Gene GM21_3354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3354
Symbol
ID	8138721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3881792
End bp	3883072
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	64%
IMG OID	644870972
Product	protein of unknown function DUF399
Protein accession	YP_003023137
Protein GI	253701948
COG category	[S] Function unknown
COG ID	[COG3016] Uncharacterized iron-regulated protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	0.331777
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTTCCC CTTCCCGTTT CCGGCATCTC GCAGCCGCCG TCTCGCTCCT TGCCATGACC 
GGTTGCAGCA CCACTTCCGG AAAACCGGTC ATCGGCAACC CCGAGGAACC CTACCCGCTA 
TCGTCCGCGC CCAAGGTGGG GGACATAATC CACCTCCCCA CCGGGGTCCT GGTAACCCCG 
GAACAGATGA AGAAAGTGGC CACGGACGCA CGGGTGGTCT ACGTGGGGGA GACCCACGAC 
AACCCCGCCT CTCACCGCCT GGAGCTGGAG ATGCTGAAGG CCCTGGAAGA GCGCTACCCG 
GGGAAGGTCG CGCTCGGCAT GGAGATGTTC ACCAGGTCCC AGCAACCCGT CCTGGACCGC 
TGGAGCGCAG GCGAGCTGGA CGAAAAAACC TTCGTCAAGG ATTCGCGCTG GTTCGACAGC 
TGGAAGATGG ATTTCGGCTA TTACCGCGAC CTGCTGCTCT ACGCCAAGGC AAAGCGCATC 
CCCATCATCG GACTGAACGC GGAGAAAAGT CTGGTGCAGG CGGTGCGGAG CAAGAATCTG 
GAAGAACTCA CCCCCGAGGA AAAGGCGCAG CTCCCCGAGC TTGACCTCTC CGACCCGTAC 
CAAAGGGCCC AGACCGAGAG CATCTTCGCG GGGCACAGCC ATGGCAAGAT GGCGGTCGAA 
GGGTTCCTGC GCGCGCAGAC CCTTTGGGAC GACACCATGG CCGAGTCGGC GGCACGTTTC 
CTGGAGAGCC CGCAGGGGCA GGACCGCCAC CTCCTGGTGG TGGCCGGCGG CAACCACGTA 
GGCCACGGCT TCGGCATCCC CCGCCGCGTC TTCCGCCGGC TGCCGACCTC CTATGTGACC 
ATAGGCGGGC ACGAGGTGAT CGTCACCAGG CAAACCGCAC CGCAAACCAT GGACGTGGAG 
ATCCCGGGAT TTCCCATGGT GGCCTTCGAC TTCCTGGTCA ACTTCGCCTA CGAGGAACTC 
CCCAAGAGCG ACGTGATGCT GGGGGTCGCC TTCGACGCCG ACCCGAGCAA GCGCGGGCTG 
CTGGTTAAAA GCGTGATCCC CGAATCGAAC GCGGCGCGCG CCGGGGTCAA GGAGGGGGAC 
CTGCTGCTGA ACCTGGACGG GGAGCCCCTC ACCGAGGCCT TCGACCTGGT CTACGCGGTA 
AAGCAGAAAC ACGCAGGCGA CCGCGGGACG CTTAAGCTTG AGCGAAACGG GGAGCCCCTG 
AGCGTCGAGG TTGAATTCAA GCAGAGCAAG CCTTACCAGC ACGGCAAGCA GGAAAACGCG 
GCCCCGAAAA AGGCGCCATG A

Protein sequence

MFSPSRFRHL AAAVSLLAMT GCSTTSGKPV IGNPEEPYPL SSAPKVGDII HLPTGVLVTP 
EQMKKVATDA RVVYVGETHD NPASHRLELE MLKALEERYP GKVALGMEMF TRSQQPVLDR 
WSAGELDEKT FVKDSRWFDS WKMDFGYYRD LLLYAKAKRI PIIGLNAEKS LVQAVRSKNL 
EELTPEEKAQ LPELDLSDPY QRAQTESIFA GHSHGKMAVE GFLRAQTLWD DTMAESAARF 
LESPQGQDRH LLVVAGGNHV GHGFGIPRRV FRRLPTSYVT IGGHEVIVTR QTAPQTMDVE 
IPGFPMVAFD FLVNFAYEEL PKSDVMLGVA FDADPSKRGL LVKSVIPESN AARAGVKEGD 
LLLNLDGEPL TEAFDLVYAV KQKHAGDRGT LKLERNGEPL SVEVEFKQSK PYQHGKQENA 
APKKAP