Gene Gmet_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_2041
Symbol
ID	3739821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	2284638
End bp	2285858
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	46%
IMG OID	637779335
Product	putative glycosyl transferase
Protein accession	YP_384995
Protein GI	78223248
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.221622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0364064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATTC TTGCCTTCCC CTATACTCAT ACACTGTCTC ATCTCAGCCG CGTTCTGGCA 
GTCGCTCTTG AGTTACGAAG GATGGGCCAT GAGGTAGTTT TTGCCGGCGA GAGCGCCAAG 
GTTTCATTTG TATCGCAGCA GGGCTTCGAT GTGGTACCCA TTCATGAACC TGATCCTGAG 
ATGCTTTTTG GCAACATTCG TTCCGGTAAG CTTCGATTTG TTGAAGATGC CGAACTGTTG 
CAAATGCTGA CGGCAGATAT AGAGGTAATT AGGTCCTTGA AACCTGATTT GGTGCTTTCA 
GACGGTAGAT TCAGTGCGCC CTTGTCTACT CATCTGACCA ATGTCAGGCA CGCTGCTATT 
GTGAATGCTT CATCAACGGA GTACCGAGCA CTCCCCTATG TGCCTTTTTT TGATTGGATG 
CCCCCCTGGC TGATTAGTCG CGATGCGATG ATCTGGAAAG CATTGGTCCG GCTGAATCTT 
TTTCTCGAAA TGAAGTTGTT TGACAATGTT ATGAAGGTAT TCAAGAGGTT AAGCCGGGAA 
TTGAACACAA ACCGAACTGT TACGGCGACA AATTGCCTTA CTGGAAAGGA TATAACACTC 
CTTGCGGATA TTCCGGAGTA TTTCCCATCG CGTAATCTGC CGGCTTCTTA TCATTATGTG 
GGACCATTAA CCTGGAAAAG TGTTCTTGCT CCCCCGGCAT GGTGGCCGCT TGATATTCCT 
TCATCTCCGC TGGTTTATGT GACAATGGGC ACAACGGGAG TTTCCGAATT TTTTTCAAAA 
CTTGGCCCAA GTCTCTCTAC ATCTTTTTTT TCGTCAATTG TAACCACTGG TGGCCAATCA 
TCAGAGCTCA AGCCGATGCC AGGAAAGGTT TATGTGGAAA GTTACCTCGA TGGCGATCTG 
GTCATGGAGC GTAGTGATGT TGTAATTTGT CATGGAGGCA ATGGCACCAT ATACCAGGCT 
CTTTCTCACG GCAAGCCAGT GATCGGCATT CCAACCATAC CTGATCAAAA ATTCAATATG 
CGCCGTGTTG AGGCAATGGG ATTTGGAAAG TCACTTGACT TAAAACAATT TTTGGAAAAG 
CCATCATTGC TTGCTGACAC GGTTAAACAA GTACTGTCTG ATCATTCGTT CCGAAATAGT 
GCCCAAAAAA TTCAAGCTGT CCTGAAATCT TATAATGCTG CAACCACCAG CGCCAAAATT 
CTCATTGATA GCATTTTATA G

Protein sequence

MRILAFPYTH TLSHLSRVLA VALELRRMGH EVVFAGESAK VSFVSQQGFD VVPIHEPDPE 
MLFGNIRSGK LRFVEDAELL QMLTADIEVI RSLKPDLVLS DGRFSAPLST HLTNVRHAAI 
VNASSTEYRA LPYVPFFDWM PPWLISRDAM IWKALVRLNL FLEMKLFDNV MKVFKRLSRE 
LNTNRTVTAT NCLTGKDITL LADIPEYFPS RNLPASYHYV GPLTWKSVLA PPAWWPLDIP 
SSPLVYVTMG TTGVSEFFSK LGPSLSTSFF SSIVTTGGQS SELKPMPGKV YVESYLDGDL 
VMERSDVVIC HGGNGTIYQA LSHGKPVIGI PTIPDQKFNM RRVEAMGFGK SLDLKQFLEK 
PSLLADTVKQ VLSDHSFRNS AQKIQAVLKS YNAATTSAKI LIDSIL