Gene GM21_3877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3877
Symbol
ID	8139251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4462731
End bp	4463783
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	58%
IMG OID	644871494
Product	TrkA-N domain protein
Protein accession	YP_003023652
Protein GI	253702463
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0569] K+ transport systems, NAD-binding component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	0.705897
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCCGG TCCGGCACCT GAAAATCTCG ATAGGAGTAT TGTTGCTCCT GCTGTCGTTC 
GGCACCTTCG GCTACATCGC TATCGAGGGG TGGGACACTC TCGACGCCTT GTACATGACG 
GTGATCACAC TGGGCACCGT AGGCTTCAGG GAGGTTCACA ACCTGAGCTC GGCCGGCAAG 
ATCTTCACCA TGCTGCTGAT ATTTTTCGGT GTCGGTGTCA TCGGTTATAT CGTGGGCAGC 
CTGGCCCAGA TCATGTTCGA GGGGCAGTTT CAGCGGATCA TGGGGAGGAA GAAGGTGGAA 
AAGGCAATTG CTGCGCTGGA AGGGCATTAC ATCATCTGCG GGTTCGGCCG GATAGGGTCG 
TTGATCTGCA AGGAGTTCTC GGCGAAGCCT CTGCCGTTCG TGGTGGTGGA AAAGGACCCG 
GCCATGGTGG ACATCATGGA GCAGGACGGA CCGGGCTACC TGGTGTTGCG CGGCGATGCG 
ACCATAGACG ACGTGCTCCT GAAGGCGGGG ATCAAGAAGG CGCGCGGACT TATTTCGGTG 
GTCACCTCGG ACACCGAGAA CGTCTACATA ACCCTCACCG CCCGCGGGCT TAACCCGGAT 
CTCTTCATCC TGGCGCGCGC CGGAGAGGAG GGCTCCGAAA TCAAGCTGAA GCGGGCCGGC 
GCCAACAAGG TCGTCTCTCC CTATCTCATC GGCGGTTCCC GCATGGCCCA GGCGATACTG 
CGCCCGACGG TGGTCGACTT CATCGAGATC GCCACGGGGC ACGAGCACAT GGAGTTGCAG 
ATGGAGGAAA TCCTGATTCC GCCAGGTTGC GGCTTCATCG GAGAGACGCT GGCCAGTTCG 
GGATTCAGGA AAGAAACCGG GGTCATCATC GTCGGCGTCA AGAAGCAAAA CGGCAAGATG 
GTGTTCAATC CGGAGTCCCA CACGAAGCTG GAGGCGCACG ACACGCTGAT CGTTTTGGGC 
GAACCCGCGG CGATTCAAAA ACTGGAGCAG TTGGTCGGCT GCGATACCTG CGCCGAAGAA 
CTGATCAAAA AGCACAGGAA AAGAGATGAC TAA

Protein sequence

MDPVRHLKIS IGVLLLLLSF GTFGYIAIEG WDTLDALYMT VITLGTVGFR EVHNLSSAGK 
IFTMLLIFFG VGVIGYIVGS LAQIMFEGQF QRIMGRKKVE KAIAALEGHY IICGFGRIGS 
LICKEFSAKP LPFVVVEKDP AMVDIMEQDG PGYLVLRGDA TIDDVLLKAG IKKARGLISV 
VTSDTENVYI TLTARGLNPD LFILARAGEE GSEIKLKRAG ANKVVSPYLI GGSRMAQAIL 
RPTVVDFIEI ATGHEHMELQ MEEILIPPGC GFIGETLASS GFRKETGVII VGVKKQNGKM 
VFNPESHTKL EAHDTLIVLG EPAAIQKLEQ LVGCDTCAEE LIKKHRKRDD