Gene GM21_3894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3894
Symbol
ID	8139268
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4480909
End bp	4482291
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	67%
IMG OID	644871511
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_003023669
Protein GI	253702480
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.0538501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGGA TCGTGATAGC GGCGCCCTCC AGCGGCTGCG GGAAGACCAC CGTGACCTTG 
GGCGTCATGG CGGCCCTGAA AAGGCGCGGC CTCAAGGTGG CCCCCTTCAA GGTGGGACCG 
GACTTCATCG ATCCCGGCTA TCACCGGGTG GCGACCGGGG TCCCCTCCGT CAACCTGGAC 
GGCTGGATCT GCGATCCCCA TTTCCTGAGG GAGAGCTTCC TCCACCATGC GGCCGCTGCG 
GACATCGCGG TCGTCGAGGG GGCGATGGGG CTCTTTGACG GGATCGACGG GCTCTCCGAA 
TCGGGGAGCA GCGCGCAGGT CGCCAAGGAA CTCGCAGCCC CCGTGGTCCT CGTGGTGGAT 
GCGCGCAGCC AGGCGAGAAG CGCCGCAGCG CTGGTGCACG GCTTCGCCGG CTTCGACCCG 
GCGCTGCGGG TGGCAGGGGT CATCTTCAAC AACGTCGCCA GCGAGAACCA CGAGCGCATC 
CTGCGGGAGG CGCTCGGCGC GGCGGTGCCG GGCGTGCAGG TGATCGGCTG CCTCCCCAGG 
GACCCCGCCC TCGCCATCCC TTCGCGCCAT CTGGGACTGG TGACGGTGGA GGACAACCCG 
CTCTCGGACC CCTTCCTGGA CCACCTGGTC GCTGTCGTGG AAGAGCACCT TTACCTCGAC 
GCGCTCCTCG ACCTGGAGGT CGACGAACTG CGGGATCATG CCGCGCCGGC CGCCGGCAGC 
CCTGCTGCCA GCCGGGACCG GGTGAGGATC GCGGTGGCGC GGGACGCGGC CTTCTGCTTC 
GTCTACGAGG ACAACCTGCG GCTCCTGGAG CAAAGCGGGG CCGAACTCTG CTACTTCTCC 
CCCCTCGCCG ACAGCTTGTT GCCGGAGGCT ATCGGCGGCA TCTACCTCCC CGGGGGGTAC 
CCTGAGCTCT TCGCGGCGCG CCTTGCCGCC AACGAGCCGA TGAAACAGGA GATCCGGCAG 
GCGGTGGAGG GGGGAATGCC CGTCTATGCC GAGTGCGGCG GGTTCATCTA CCTCACCCGT 
GGGGTGGCCG CGGAGGGGGA AAGCCATGGC TTTGCCGGCA TCTTCCCGGT AGAGACCCGG 
ATGCTGCCGC GCCGCAAGGC GCTCGGGTAC CGCGAGGTGG AACTGCTGGA AGATTGCACG 
CTCGGCCGCA AGGGGAGCAT CGCCCGCGGC CACGAGTTCC ACTACTCCGA GATGCAGGAA 
ATGCCCCCCA ACGTGGAGCG CCTGTACCGG GTCACCCGCA AGGGGGTGGA ACTCGCGCCC 
GAAGGTTACC GTTACAAAAA CTGCCTCGCC TCTTACATAC ATCTACACTT CGGCAGCTCG 
CCAGGCCTGG CTCCTCACTT CGTGGAACAG GGAAGGGCGT ACCAAAAAAG GAGCCTCACA 
TGA

Protein sequence

MKRIVIAAPS SGCGKTTVTL GVMAALKRRG LKVAPFKVGP DFIDPGYHRV ATGVPSVNLD 
GWICDPHFLR ESFLHHAAAA DIAVVEGAMG LFDGIDGLSE SGSSAQVAKE LAAPVVLVVD 
ARSQARSAAA LVHGFAGFDP ALRVAGVIFN NVASENHERI LREALGAAVP GVQVIGCLPR 
DPALAIPSRH LGLVTVEDNP LSDPFLDHLV AVVEEHLYLD ALLDLEVDEL RDHAAPAAGS 
PAASRDRVRI AVARDAAFCF VYEDNLRLLE QSGAELCYFS PLADSLLPEA IGGIYLPGGY 
PELFAARLAA NEPMKQEIRQ AVEGGMPVYA ECGGFIYLTR GVAAEGESHG FAGIFPVETR 
MLPRRKALGY REVELLEDCT LGRKGSIARG HEFHYSEMQE MPPNVERLYR VTRKGVELAP 
EGYRYKNCLA SYIHLHFGSS PGLAPHFVEQ GRAYQKRSLT