Gene GM21_1354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1354
Symbol
ID	8136682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1596528
End bp	1597757
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	60%
IMG OID	644868968
Product	Sporulation domain protein
Protein accession	YP_003021171
Protein GI	253699982
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	5.89794e-26
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCTCAATA TTCGAATGCT TGTGGCGTGG ATGTTGTTGT CCGTTTTTTG CTGTCCGCTG 
ATATCACATG CGGCGCAGCC TGATGAAGCT GCGATGATGG CTACTGCGAA GGGCCATTTT 
CAAGACGGCG GCTATTACTA CGCTTCAACC TGGCTGGAGC GGATACTGAA AAAATGGCCC 
AAAACCGGTC AGCGCGAGGA AGCTCTGGTG ATGCTGGCCA AGTCGTATGC CGCTACCGGG 
CGGGAGGAGA AGGCGGCGCG TACGGTAAAG ACCCTGTTGA AAGAATATCC CCAGACGGCC 
GCCAAACTGG ATCCGGAGAT GCTGAAGCTG GCCCAGGAGA CCTACGCTGA GGCGCCGCCG 
GCTTTCCAGG CAGCCGAGGC GCCTGCACCG GCGCCTGTCG CTCAGGCTGT TTCGGAAACG 
GCGAAAGTTG CAGAGGCCGC GGTTGCCCCT GCTGCCGCCG GAGTCAAGTC CGCTGTTGCG 
GTCGCTGTCC CTGCTCCCGC GCAACCAGCC GCTTCCGCCC AGGCCGTACC CGAGGCCCTC 
AAGGAAATCG CTTCTACCGA GTCCACCGAA CCGGCCGCGG CGAAGCTCCC TGCTGACGCC 
AAGACGCCTG TCGCAGCGCA GGCGTCGGCT AAGCCCGATG TGGCCACACC TGCTGCGGCG 
CAAGTCGCCA TAGCTGCTTC CGTCCCGGCC AAGCCGGTGA TTTTGCCTGT CGCTGCCGCA 
AGCGCGGCTG AGACGGAAAC AGCCTGCCGC GACAACTCCG CAACCGCCAC GGGGACCTAT 
GCCATAGAAC TTGGCGAGTT TATCGGGAAG AACTCGTTGG TCAGGGCGAA GAAAGCGGTC 
AAGAAAGCGG GGCTTGTGCC GGTTGTCGCG CAGGGGCGCC AGAAAGTTGA AGTGATGTTG 
CGGATACTGA TGGGTGAATA CCACGACGAA GGCGCAGCAA AGAAAATGCT GAATAAACTG 
CGAAAGGCCG GTGCCGAGCA TTTCATGCTC AAAGACAAAG GGAGGACCTT CCGCGTTTAT 
GCCGGGTCCT ACTTCGAGCA CCAGGGCGCT CTTGACGAGC AGAAGCGTCT CTTGGCCCAA 
GGCCTTGATT CGGAGTTGAG GGAGGCAACC GTCACTGTCT CGACCTACCT CATCAACGCC 
GGCTGTTTTC CCACGGACCA GGCCGCCAAG GGGAAGCTGG CTGAGTTGGA GCGTATGGGA 
CTGAAAGGTA AGGTACTCCC TCCTCAATAG

Protein sequence

MLNIRMLVAW MLLSVFCCPL ISHAAQPDEA AMMATAKGHF QDGGYYYAST WLERILKKWP 
KTGQREEALV MLAKSYAATG REEKAARTVK TLLKEYPQTA AKLDPEMLKL AQETYAEAPP 
AFQAAEAPAP APVAQAVSET AKVAEAAVAP AAAGVKSAVA VAVPAPAQPA ASAQAVPEAL 
KEIASTESTE PAAAKLPADA KTPVAAQASA KPDVATPAAA QVAIAASVPA KPVILPVAAA 
SAAETETACR DNSATATGTY AIELGEFIGK NSLVRAKKAV KKAGLVPVVA QGRQKVEVML 
RILMGEYHDE GAAKKMLNKL RKAGAEHFML KDKGRTFRVY AGSYFEHQGA LDEQKRLLAQ 
GLDSELREAT VTVSTYLINA GCFPTDQAAK GKLAELERMG LKGKVLPPQ