Gene Phep_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2031
Symbol
ID	8253135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	2340082
End bp	2341263
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	38%
IMG OID	644935679
Product	glycosyl transferase family 2
Protein accession	YP_003092298
Protein GI	255531926
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.000685673
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTATAG CTTTCTGGAT TTGCCTCTTC ATTATCATTT ACACTTTTAT TGGATATGGT 
CTTGTTTTGT TCTTTCTGGT TAAAATTAAA AGAATATTCA CAAAACCACA GGTTTTTATA 
CCTGTACCAG ATGATCTTCC TAATGTTACC TTGTTAATAG CCGCCTATAA TGAGGAGGAC 
ATTATTGCCG ACAAGGTAAA TAATACATTG GAACTGAATT ATCCAAAAGA CAGATTACAG 
ATTGTCTTTA TTACGGACGG TTCCAGTGAC CGCACGGTTG AACGGTTAAG AAATAGGGAG 
GGCATTACTT TGTTGCATGA AGATACACGC GCTGGAAAAA TGGCAGCCAT TAAACGGGCC 
ATACCTTTTA TCAATGGAGA CATCACTGTA TTTACAGATG CAAATACCTT TTTAAATAAA 
GATGCCATCC TTGAGTTGGT AAAACACTAT CAGAACAATA AAGTTGGTGC AGTGGCTGGC 
GAAAAAAGAA TTTTGGTGGA AGATAAAGCC GATGCCAGTT CGGCAGGAGA AGGCTTTTAC 
TGGAAATACG AATCAGCACT TAAAAAGTGG GACTATGAGC TATATTCTAA TGTAGGAGCT 
GCCGGAGAAT TATTTAGCAT CAGAACAGCA TTGTATCAGC CTGTTGAATC GGATACCATT 
ATTGACGACC ATATGATTGC CATGCGAATT GCTGAAAAAG GTTATGTTAT TGCCTACGAA 
CCCAATGCTT ATGCCATGGA AACAGCCTCG GCAAATACCA AAGAAGAATT AAAAAGAAAA 
ATAAGAATAG CAGCGGGAGG CATTCAGTCC ATCTTAAGAC TAAAGAAAGC AGCAAATCCG 
CTTTATTATC CTGTGCTCAC ATTTCAATAT ATCAGTCACA GGGTTTTAAG ATGGACGGTT 
ACCCCAATTT TGCTTGTAGT CACTTTTCTG TTGAATGGTT TAATTGTGTT AAATGGTGAC 
AGAGGGATTT ATCTGGTTAT CTTTGGTGCC CAGGTTGTGT TTTACGTCCT GGGCCTGACG 
GGGATGATCT TTGAAAGAAG GAACATTAGA ATCAAAAGTT TCTTCATCCC ATATTATTTT 
TGTGTAATGA ATTATGCAGT AATTGCTGGA GCCATCAGAT ATTTTAAAAG ACAACAAAGC 
GCGGCATGGG AAAAATCTGA AAGAAAAACA GCTCAAACCT GA

Protein sequence

MIIAFWICLF IIIYTFIGYG LVLFFLVKIK RIFTKPQVFI PVPDDLPNVT LLIAAYNEED 
IIADKVNNTL ELNYPKDRLQ IVFITDGSSD RTVERLRNRE GITLLHEDTR AGKMAAIKRA 
IPFINGDITV FTDANTFLNK DAILELVKHY QNNKVGAVAG EKRILVEDKA DASSAGEGFY 
WKYESALKKW DYELYSNVGA AGELFSIRTA LYQPVESDTI IDDHMIAMRI AEKGYVIAYE 
PNAYAMETAS ANTKEELKRK IRIAAGGIQS ILRLKKAANP LYYPVLTFQY ISHRVLRWTV 
TPILLVVTFL LNGLIVLNGD RGIYLVIFGA QVVFYVLGLT GMIFERRNIR IKSFFIPYYF 
CVMNYAVIAG AIRYFKRQQS AAWEKSERKT AQT