Gene GM21_0292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0292
Symbol
ID	8135599
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	361230
End bp	362474
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	59%
IMG OID	644867912
Product	HipA N-terminal domain protein
Protein accession	YP_003020134
Protein GI	253698945
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	182
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAGGA CGCTGCAGGT CTATTGGGAA AGCCGGCGGG TAGGGGAATT GACCCAGGAA 
GACGGGACCC TTACCTTTAG CTACGATGGC GACTACCGCT CTTCGCCCGG TGCCCAGCCG 
CTGTCGCGGC AGCTCCCGCT CACTAGCGCG GAGTTTGCCA ATGCAGCGGC CAGTGCCTTC 
TTTTCGAACC TCTTACCCGA GGGAGGAATC CGGCGACGGG TGGCCCGACA ATTAGGAGTC 
TCGGCTGAAA ACACATTCGG ACTCCTGGAA GGAATTGGAG GGGACTGCGC GGGGGCAGTT 
TCGGTGCTGC GACCGGGAGA GGTTCCTCTT CAGAGTGGCA GGTACCGTCC CATTTCTACC 
GACGAGCTCG GACGTGAGCT GGCCTCGCTA CCGTCGCATC CCTTCCTTGC CGGGGAGGAG 
GGAGTGCGGC TCTCCCTGGC CGGAGCCCAA AACAAGCTTC CGCTCTTTGT TGACCAAGAC 
GCATACTTCA TCCCAGAGGG TAACCTTCCC TCCTCGCACA TCCTCAAGAT AGCGATCGAC 
AAGCTGGAGG ATACGGTGAC GAACGAGGCG TTCTGCATGA CACTGGCGCG TCGGGTAGGA 
CTCTTGGTGC CGGAAGCGCG TGTCGTCGAA ATCGCTGGGG AAAAGGTCTA TCTGGTGGAA 
CGTTATGACC GTGTCCGGAC TGCTTCCGGC AGCGTGGAGC GGCTGCACCA GGAGGATTTC 
TGTCAGGCAC TGGGCGTCTT TCCTGAGTTA AAGTACGAAC AGGAGGGAGG CCCCGGCTTT 
GCGCAATGCT TCAGCTTGGT GGGGGGCTGG AGCGTGGAGC CGATACTGGA CACGCTGAGC 
CTGCTCCGAT GGGCACTTTT TAATTTTCTA ATTGGGAATG CGGATTCCCA CGCCAAGAAC 
CTCTCCTTTC TCTACCATGC CGGAAGCGTC CGGCTGGCCC CTTTTTATGA CCTGCTCAGC 
ACCGCGGTCT ACGAGCGGGT CAACAACAAG TTCGCAATGA AGATGGGAGG GCAGAAGGAT 
CCCCGATATC TCATGCCGCA GGATCTTGCC GCCTTCGCCA AAGAGGTGGG AATCGGCCTG 
CGCACGGTGA AAGGGCAGTT GGCGGAACTG TGCCAAAAAG TGACTGATGA GATCGCGCCT 
CTGGCACAAA CGTATCGCGA CAGGTATCAA GATCCTCCCA TCGTAGCAGA CATCCTCCGC 
GTGGTTGATC AACGCATCCG CAAAGCCCGA ACCCTCGCCT CCTGA

Protein sequence

MRRTLQVYWE SRRVGELTQE DGTLTFSYDG DYRSSPGAQP LSRQLPLTSA EFANAAASAF 
FSNLLPEGGI RRRVARQLGV SAENTFGLLE GIGGDCAGAV SVLRPGEVPL QSGRYRPIST 
DELGRELASL PSHPFLAGEE GVRLSLAGAQ NKLPLFVDQD AYFIPEGNLP SSHILKIAID 
KLEDTVTNEA FCMTLARRVG LLVPEARVVE IAGEKVYLVE RYDRVRTASG SVERLHQEDF 
CQALGVFPEL KYEQEGGPGF AQCFSLVGGW SVEPILDTLS LLRWALFNFL IGNADSHAKN 
LSFLYHAGSV RLAPFYDLLS TAVYERVNNK FAMKMGGQKD PRYLMPQDLA AFAKEVGIGL 
RTVKGQLAEL CQKVTDEIAP LAQTYRDRYQ DPPIVADILR VVDQRIRKAR TLAS