Gene GM21_2197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2197
Symbol
ID	8137533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2567110
End bp	2568309
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	61%
IMG OID	644869812
Product	FAD dependent oxidoreductase
Protein accession	YP_003022007
Protein GI	253700818
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.000547368
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTTCG ACAACGCCGG AATACTTATC GTCGGGGGGG GCATTATCGG CCTCACCATC 
GCCCGCGAAC TGGTGAAGCA GGGACACGGC GACATCGTCA TCATCGAGAA GGAAACGGAG 
CTGGGCGTCC ACGCCTCGGG CCGCAACAGC GGCGTGCTCC ATGCCGGCAT CTACTATTCC 
CCGGATAGCC TCAAGGCCAA ATCCTGCTTG AACGGCAACT TCCTGATGCG GGAATACTGC 
AAGGAGAAGG GGCTTCCGCT TCTGGAGAGC GGCAAGGTCA TCGTCACCCG CACCGCGGCC 
GAACTCCCGG TCTTGGACGA ACTGCACCGG CGAGCGACGG CAAACGGCGC CAAGGTGGAG 
ATGATCGACG AGCGGCAACT GGCTGCCATA GAGCCGAACG CCCGGACGGT GGAGCGCGCG 
CTCTTCTCGC ACTACACCGC GGTGGTTGAC CCTAAAGCGG TGCTGAAGAG CCTCAAAAAG 
GACCTGGAAC AGACCGGACG GGTGAAGCTT CATCTGGGCT GCAAAATGAC CGGCCTCAAG 
GGAAGCTCCA CGGCGGTGAC CAACAAGGGG GATATAAGCT TCGAAAGGTT CATCAACGCC 
GCCGGCGCCT ACTGCAACAA GGTGGCGGGC TTCTTCGGGG TGGGTGCCAA ATACCGGCTG 
ATCCCCTTCA AGGGGGTGTA CCGACTGCTG AAAAAGGATG CCCCCTTTAC CGTCAATTCC 
AACATCTACC CGGTGCCCGA CATCCGGAAC CCCTTTCTGG GGATCCACTT CACCCGCAGC 
GTCCACGGCG ACGTCTACCT GGGCCCCACT GCCATCCCCG CTTTCGGGCG GGAGAACTAC 
GGCATCCTCT CGGGCATCGA CGCCGAAGCC TTCAGCATTG CCTGGCAGGA CCTGGTCCTA 
TTTCTCGTCA ACCGGCCTTT CCGCAATGTC GCTCTCTCGG AGCCGCTCAA GTATTTTCCC 
TCTTACTTCT TCCGCGACGC AGCGAAGCTG GTGAAGGAGT TGGCCCCCTC CGACGTGGTG 
CATGCTTCCA AGGTGGGGAT ACGTCCGCAG TTGGTCGACT GGGAGAAGAA GGAGCTGGTG 
ATGGATTTCC TGGTGGTGGC CGATGGGTCG TCGCTCCACG TGCTGAACCC GATCTCCCCC 
GCTTTCACCT CGTCGATGGA TCTGGCGCAG GGGATGGTGG CGGAGCATTT CTCGTCCTGA

Protein sequence

MSFDNAGILI VGGGIIGLTI ARELVKQGHG DIVIIEKETE LGVHASGRNS GVLHAGIYYS 
PDSLKAKSCL NGNFLMREYC KEKGLPLLES GKVIVTRTAA ELPVLDELHR RATANGAKVE 
MIDERQLAAI EPNARTVERA LFSHYTAVVD PKAVLKSLKK DLEQTGRVKL HLGCKMTGLK 
GSSTAVTNKG DISFERFINA AGAYCNKVAG FFGVGAKYRL IPFKGVYRLL KKDAPFTVNS 
NIYPVPDIRN PFLGIHFTRS VHGDVYLGPT AIPAFGRENY GILSGIDAEA FSIAWQDLVL 
FLVNRPFRNV ALSEPLKYFP SYFFRDAAKL VKELAPSDVV HASKVGIRPQ LVDWEKKELV 
MDFLVVADGS SLHVLNPISP AFTSSMDLAQ GMVAEHFSS