Gene GM21_3733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3733
Symbol
ID	8139107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4300166
End bp	4301410
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	68%
IMG OID	644871352
Product	competence/damage-inducible protein CinA
Protein accession	YP_003023510
Protein GI	253702321
COG category	[R] General function prediction only
COG ID	[COG1058] Predicted nucleotide-utilizing enzyme related to molybdopterin-biosynthesis enzyme MoeA
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain [TIGR00199] competence/damage-inducible protein CinA C-terminal domain [TIGR00200] competence/damage-inducible protein CinA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	122
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGTGT CGGTTCTCTC CATAGGCGAC GAGCTCCTTT GCGGCGAGGT TGTGGACACC 
AACGCAAGCC ACATCGCCGG CCGGCTCTTT CAGGCGGGGG GGCGGGTGGA GCGGCACCTG 
ACCGTCCCCG ACGACGCGGA GGCGATCGTC CGCGCCCTCA CGGAGCTCGG CGCACGCAGC 
GAAGCGGTTA TCGTCACCGG GGGCTTGGGC CCCACTCCGG ACGATCTCAC CGCCGAGGCC 
GCGGCGCGGG CAGCCGGAAC GGAACTGGAG CTCTCAACGG AAGCGCTGAC CCACCTGGAG 
CGTTTCGCGC AAAGGATCAC CGGAGAGCTG CACCCGGCCA ACCGCAGGCA GGCGCTTCTC 
CCCAGTGGGT GCAGGCTGAT CCCCAACCCT TTGGGGACCG CCTTGGGCTT CGTGGTCCGC 
ATAGGCTGCG CCGACTGCTT CTTCATGCCC GGCGTCCCTT TCGAGATGGA GCGGATGCTG 
GAGGAGACGG TGCTCCCGGA GCTGCGGAAC AGGTTTCCGG CCGGCTGGCA GCGGGTGACA 
CTGAAGCTCT TCGGCATCGC GGAGGCTGCC ATCGCGGAGC TTTTGGAGGG GGCGATTCCC 
GAAGGGTCCC GGGTGCAGCT TGCCTACTGC GTGAAGTTCC CGGAGATCCA CCTGATCCTG 
CGGGCCAGCG CCACCGACGC GCCAGCCTTG CAGCAGGCGG CCGGCGAGCT GCGGCGGCGT 
CTTGGCGCCT ATCTCTTCGC CGAGGACCGG GAGGAGATGG ACGACCGGCT GGCGCTTTTG 
CTGCGGGAAA GCGGCCTCAC CCTGGCGCTC GCCGAATCCT GCACCGGCGG CATGATCGCC 
GCCCGCATCA CCGCCGTCGC CGGAAGCTCC GCCTATTTCC TTGAGGGAAA CGTCACCTAC 
AGCAACGAGG CGAAGACCAG GATGCTGCAG GTCCCACCCC CCCTGATAGC CGAGCACGGC 
GCGGTCAGCG CCGAGGTCGC CCGCGCCATG GCGGTCGGGG CCAGGGAGGC GGCGGGAAGC 
GACCTGGCTT TGTCGGTGAC CGGCATCGCC GGCCCGGACG GGGGGACCCT AGAGAAGCCG 
GTCGGCACCG TCTACCTGGC CCTTGCCGAC CAGGGCTCTT GCCGGGTCGA GCGCTTCAAC 
TTCCAAGGCG ACCGCGACCG CGTCCGTTGC ATCACATGCT TCACCGCGCT CAATTGGCTG 
CAAAGCTACC TCCTCACGCG TAAGACGACA CCAGGCCGGG GTTGA

Protein sequence

MRVSVLSIGD ELLCGEVVDT NASHIAGRLF QAGGRVERHL TVPDDAEAIV RALTELGARS 
EAVIVTGGLG PTPDDLTAEA AARAAGTELE LSTEALTHLE RFAQRITGEL HPANRRQALL 
PSGCRLIPNP LGTALGFVVR IGCADCFFMP GVPFEMERML EETVLPELRN RFPAGWQRVT 
LKLFGIAEAA IAELLEGAIP EGSRVQLAYC VKFPEIHLIL RASATDAPAL QQAAGELRRR 
LGAYLFAEDR EEMDDRLALL LRESGLTLAL AESCTGGMIA ARITAVAGSS AYFLEGNVTY 
SNEAKTRMLQ VPPPLIAEHG AVSAEVARAM AVGAREAAGS DLALSVTGIA GPDGGTLEKP 
VGTVYLALAD QGSCRVERFN FQGDRDRVRC ITCFTALNWL QSYLLTRKTT PGRG