Gene Gmet_2029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2029
Symbol
ID	3740686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2270200
End bp	2271756
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	52%
IMG OID	637779323
Product	lipopolysaccharide biosynthesis
Protein accession	YP_384983
Protein GI	78223236
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3206] Uncharacterized protein involved in exopolysaccharide biosynthesis
TIGRFAM ID	[TIGR03007] polysaccharide chain length determinant protein, PEP-CTERM locus subfamily

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.911023
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.105361
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATCAA AGACGGAAGA GTTGAATAAA TACCTGAAAA TGCTCATGAA GAGGAGGTAT 
CTCTTTATTG TGGTATCTCT TGTGGTGATG TCTGTTATTG CCTGGGGAAG CTTTTTCCTC 
CCCAAGAAAT ATGAGGCATC GAGCACGGTA TTCATCGAAA AGAGCGTCAT CAAGGATCTG 
GTGAAGGGGA TCACCTTTAC CCCTTCTGTC GAGGACAAGG TTCGCATCCT GCGGTATGCC 
ATGCTCAGCC GCACTTTCGT GACCAATGTT CTGAAATCAC TTGATGCTGA TACGAAGGTA 
AAGAACGATA AAGAGATGGA AGGTCTTGTT GAAGACTTCC AGAAAAGGAC GCAAATAAGC 
ATCAAGGGTA ATGACCTTTT TATCGTCAGC ATCCGGGACA AGGATCCGAA GCTCGCTACT 
GACTACGTCA ACACGCTTGT CAGAAAGTAT GTGGAGGAAA ACGTCTCCAG CAAGCGGCAG 
GATTCCTTTG GCGCTGATCG GTTCATCTCC GAGCAGCTAA AAACCTTCAA GGACAAGCTT 
GACGAGTCCG AGAACAAGAT CGTTGCTTTT CGTCAGAAAC GGGGCGTGTC GGTGGGGATT 
GACGAGGCGC TTCTCGTTAA TGACATTCGC CAATATCAGG GAGAACTCGA CTCAATGCGG 
ATCAAACGGA ATGAGTTGAC CGCAACACGG GATGCTCTCA GGCGCCAGCT CAAGAGCATC 
AAGCCCACCA CCGTCGCTCT CTCGTCCCGG GAGAACTCGA GCGAGGTTGA GATGCTCGAG 
CGCAGGCTCA AACAGCTCTC TGCCAATTAC ACCGACAACT ATCCCGAGGT AATTCGCATC 
AAGAGTATCA TCGCATCGCT CAAGAAAAAG CAGGAGCCGG GCCATCAGGC TGATACAGGG 
GCGAAAGAGG AATTCAGCAC GGCCAACCCC GTGTACCAGA ATCTCGAGCA GCAGTTGTAC 
CAGGTTGAGG CAGAACTTGA GGCGGTCAAC GCCAAACAGC GCCAGCTCCA TGCAACCATA 
GGCGGCAAGG AACATGAACT TCGAAACGTT CCGGCTGACC AGAAGACACT GACTGACCTC 
ATCAAGGAGC GCGACGCCAA TCGGCAGTTG TACGAGCAGC TTCTCACCCG GCAGGGACAG 
GCTCAACTCA CGAAGGAGAT GGAGGTAGAG GACAAGGCCA CGACGTTCAG GGTTGTGGAC 
CCGGCCATCG TGCCGATGAA ACCGGTCAGC CCCGACCGGG TCAAGATGAT CATTATGGGC 
ATCATCATGG GATTCGTTGC CGGCGCCGCC TCAGTCTTTG TCATGGAGAT GTTCGACTCC 
TCCGTCAAGG ATGTCACCTC TCTCAAGAAG CTTGGTTTTG AGGTGCTCGC AGTAATCCCG 
ACCATTTTCA ACCAGGAAGA AGCAAGCAAG GTAGCGAAGA AAGATCGAAA GATATATCTG 
GTCGCGGGCT GTTACTTCGC TCTCATCTGC TTGATGCTTA CCCATGAATT GCTGGGATTG 
ACTCTGATCG AGAAGGTCCT CACCAAACTG GGGCTTGATC AGTTCATCAT GAGCTGA

Protein sequence

MVSKTEELNK YLKMLMKRRY LFIVVSLVVM SVIAWGSFFL PKKYEASSTV FIEKSVIKDL 
VKGITFTPSV EDKVRILRYA MLSRTFVTNV LKSLDADTKV KNDKEMEGLV EDFQKRTQIS 
IKGNDLFIVS IRDKDPKLAT DYVNTLVRKY VEENVSSKRQ DSFGADRFIS EQLKTFKDKL 
DESENKIVAF RQKRGVSVGI DEALLVNDIR QYQGELDSMR IKRNELTATR DALRRQLKSI 
KPTTVALSSR ENSSEVEMLE RRLKQLSANY TDNYPEVIRI KSIIASLKKK QEPGHQADTG 
AKEEFSTANP VYQNLEQQLY QVEAELEAVN AKQRQLHATI GGKEHELRNV PADQKTLTDL 
IKERDANRQL YEQLLTRQGQ AQLTKEMEVE DKATTFRVVD PAIVPMKPVS PDRVKMIIMG 
IIMGFVAGAA SVFVMEMFDS SVKDVTSLKK LGFEVLAVIP TIFNQEEASK VAKKDRKIYL 
VAGCYFALIC LMLTHELLGL TLIEKVLTKL GLDQFIMS