Gene Daro_3922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3922
Symbol
ID	3567653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4218001
End bp	4219446
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	60%
IMG OID	637682396
Product	carbonic anhydrase
Protein accession	YP_287120
Protein GI	71909533
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3338] Carbonic anhydrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	67
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCACC TGATCATCGC CAGCCTGCTG GCCGCCCTGC CTTGGGCTGC TTCGGCTGCC 
CCAACCTGGC AAACCATCTC GTCAGAACCG GGCAAGCGCA TCGAGATCGA CCGCACCAGC 
CTGAAGCGCG AAGGGAGCAC CGTGCAGGCT CAAGGGCGCA TCGTCCTTGA AAAAGAGCTG 
ACTGACGCAA AATCAGGCGC CGGCTACCGG GTCATCGAAG CAATTACCCG CTACGACTGC 
AACACGCGCA ACGCCAACAC GATCAAACGC ATTTTCAAGA AAAACGAAAA CGAAGTCATC 
CGCGAGGAAG AAATCAAGGG CTCCGACCTC CCGGTACGCA CCGGCACGCT GGACGACAAG 
GTATTGCGTG AAGTCTGCCG CCCGCCGAAG GAAAGCCCGG CAGAACTGGC CAAAAAAGCC 
AATGAAGCAG CTGGCGAACT GAAGGCTGCC AACGACGCGC TGCTCAAGAA GGAAATGGCC 
AAGGCCGAAA AGCCGGCAAC CATCAAGGCC AGCGATGTGC CGGACAAGGA AGCGGAACAC 
GGCGCCATTC CCTCGATCCG CCCAAACCTG AAGGCAGCAA CGGAAAGCGC CAAGGAGACG 
GCACCAGCCC CAACGCCGGC AGCTGCGCCG GCCAAAGCAG TGGCCCCGGC AAAAGCGGCG 
ACCGTCGTCG TGCACACCAC CCCAGCCCCA GCGCCCAAAG CCAGGAAGCC AGCCAGGTCT 
GAAGGCTATA TGCTGGAATT GACTCATTCC GAACCTGCCG CACAGCACGC CCAAATTCAC 
TGGGCCTACG ATGGTGCCGG CGCCCCGGAA AACTGGCCCA ATCTCGACCC GAAGAACAAG 
GTGTGCGCGA TCGGCGAGCG CCAGTCACCA ATCGACATCA AGGACGGCAT CAAGGTCGAC 
CTGGAGCCGA TCAAGTTCAA GTACCAGCCC TCTACCTTCA GGATCGTCGA CAACGGCCAT 
ACCGTGCAGG TTGAAGTCGG CGATGGCTCG ATTTCTCTGA CCGGCAAAAC CTATGAACTG 
GTCCAGTTCC ACTTCCATCG CCCGTCTGAA GAAAAGGTAA ACGGCCAGCG CTTCGACATG 
GTCGTCCATC TGGTGCACAA GTCGGATGAC GGGCAACTCG CTGTTGTCGC CGTGCTGCTC 
GAACGTGGTA CCGAGAACCC CTTCATCCAG ACGCTGTGGA ACAACATGCC ACTGGAAAAG 
AACATGGCCG TTGCCCCTCC GACGACTACC ATCGATCTGA ACACCCTGCT ACCAGCTACC 
CGCAACTACT ACACCTACAT GGGCTCGCTG ACCACGCCAC CGTGCTCCGA AGGGGTGCTG 
TGGCTGGTCA TGAAACAACC GGTGCAAGTT TCGCAGGATC AGATCAACAT TTTCAGCCGC 
CTGTACAAAA ACAACGCCCG GCCGATCCAG CCCTCCGGCG GACGCCTGAT CAAGGAAGGC 
CGTTGA

Protein sequence

MRHLIIASLL AALPWAASAA PTWQTISSEP GKRIEIDRTS LKREGSTVQA QGRIVLEKEL 
TDAKSGAGYR VIEAITRYDC NTRNANTIKR IFKKNENEVI REEEIKGSDL PVRTGTLDDK 
VLREVCRPPK ESPAELAKKA NEAAGELKAA NDALLKKEMA KAEKPATIKA SDVPDKEAEH 
GAIPSIRPNL KAATESAKET APAPTPAAAP AKAVAPAKAA TVVVHTTPAP APKARKPARS 
EGYMLELTHS EPAAQHAQIH WAYDGAGAPE NWPNLDPKNK VCAIGERQSP IDIKDGIKVD 
LEPIKFKYQP STFRIVDNGH TVQVEVGDGS ISLTGKTYEL VQFHFHRPSE EKVNGQRFDM 
VVHLVHKSDD GQLAVVAVLL ERGTENPFIQ TLWNNMPLEK NMAVAPPTTT IDLNTLLPAT 
RNYYTYMGSL TTPPCSEGVL WLVMKQPVQV SQDQINIFSR LYKNNARPIQ PSGGRLIKEG 
R