Gene GM21_0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0447
Symbol
ID	8135756
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	539337
End bp	540578
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	58%
IMG OID	644868065
Product	hypothetical protein
Protein accession	YP_003020285
Protein GI	253699096
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	101
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAAGA AGTTGATTAC CAGCACGTTG ACCGCAGCAC TTATTGCCGT ATCCACCATA 
GCCGGAGCAT CGGAAATAGA TACCCTCCGC AAACAGGTTG ACGACTTGAG CGACCAGGTC 
AAGCTGCTGC AGTCAAACTC CGCGACCGCG ACGGCGGGAT CGGGCTTTCG CAAGAAGCTT 
TGGGACAACA CCAGGTTCGG GGGCTACGGA GAGCTCGACT ACATCGTGAA GCGTGAAAAC 
GGCAACGGCA AAGGCGCCAA CGTCTTCGAT CCGCATCGCC TGGTGCTGTA CGTAAACTCG 
GACCTCTCCG ATTGGATCAC CCTGAACACA GAACTCGAGT GGGAGCACGC CGGTGCCAAC 
GAAAAGCTGG CCAGCAGCAA CGAATTGTCC GGCGAAGTCG TGGTCGAGCA GGCCTTCCTC 
GACTTCAAAC TGCAGCGGGC GTTCAACGTG AAAGCCGGCA TCATGCTGGT GCCGCTGGGG 
GCGACCAACC TGTACCATGA GCCGACCAAC TTCAACTCCA CCGAGCGTCC CGAGCTGGAC 
CGCTACCTGA TCCCTTCCAC CTGGCGCGAG ATGGGCGTAG GCATCCACGG CGCGCTGGGC 
GACAGGGTGG ATTACCAGTT GATGGTCATG AACGGCCTGG ACGGGACCAA GTTCAACGGC 
AAGAACGGCA TCCGCGACGG CAGACAGAAC ATGAACAAGG ACATCAACCG AAACAAAGCC 
GTAGCCGGTC GCTTAGAGGT CAGGCCCGCG ACCAACCTGT ACACCAACCT CTCCTTCTAC 
AGCGCGAATT CGGCCAAGGA AGGAAACGCC TACACCACTG TTGCGGCAAT CGATAGCAGG 
TACAGCATCG GGAAGCTTGA GTTGGGAGGC GAGTACGTCC ACGTCTACCA GAACAACCCG 
GCCCTTTTGA ACGATGAACT CGGGCACAAC ATGTCCGGCT ATTGGGTCGA GGGCGCATGG 
CACGCAATGC CGCAGAGCTG GAAAAAAGGG AAGCTGGCCG AAGCCGATGC AGTGGTTTTC 
GTGAGGTATT CCGAAATAGA CACCCAGACC GGCGGGGCGA TCAACCCGGC GAAAGACAAT 
GGCAAGTTCG ACAGGAACTA CACCACCTTC GGCGTCTCGT TTAAGCCCGT CACCCAGTTG 
GCCATCAAAG CCGACTACCA GATCTACGAC GATCATGGCG CAGGCGGGAA AGACAAGCTC 
GACAACGACA AGTTCCAGCT AACCTTGGGA TTCGTCTTCT AA

Protein sequence

MHKKLITSTL TAALIAVSTI AGASEIDTLR KQVDDLSDQV KLLQSNSATA TAGSGFRKKL 
WDNTRFGGYG ELDYIVKREN GNGKGANVFD PHRLVLYVNS DLSDWITLNT ELEWEHAGAN 
EKLASSNELS GEVVVEQAFL DFKLQRAFNV KAGIMLVPLG ATNLYHEPTN FNSTERPELD 
RYLIPSTWRE MGVGIHGALG DRVDYQLMVM NGLDGTKFNG KNGIRDGRQN MNKDINRNKA 
VAGRLEVRPA TNLYTNLSFY SANSAKEGNA YTTVAAIDSR YSIGKLELGG EYVHVYQNNP 
ALLNDELGHN MSGYWVEGAW HAMPQSWKKG KLAEADAVVF VRYSEIDTQT GGAINPAKDN 
GKFDRNYTTF GVSFKPVTQL AIKADYQIYD DHGAGGKDKL DNDKFQLTLG FVF