Gene Ndas_2901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2901
Symbol
ID	9246752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	3468547
End bp	3470910
Gene Length	2364 bp
Protein Length	787 aa
Translation table	11
GC content	73%
IMG OID
Product	Carbonate dehydratase
Protein accession	YP_003680818
Protein GI	297561844
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0652695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAACG ACGCCCAGGG AGTCACGCCC GAGAGGCCGC CCACGGCCTC ACCCGGGCAA 
CGTTTCGACC GCCACAGGGG GATCGCCGCC GACGTCGGCG CCTCACTGGT GGTCTTCCTG 
GTCGCCGTCC CCCTGTCCCT GGGGATCGCC GTCGCCTCCG GCGCCCCCCT CATCGCCGGG 
ATCATCGCCG CCGTGGTCGG CGGGATCGTC GCCGGACTCG TCGGCGGGTC CGTGGTCCAG 
GTCAGCGGCC CCGCCGCCGG CCTGACCATC ATCGTCGCCG ACCTGGTCAT GACCTACGGA 
TGGCGGGTGA CCTGCCTGAT CACCCTGCTG GCCGGGCTGG TCCAGCTCGC CCTCGGCGCC 
TTCCGCATCG CCCGGGCCGC CCTGGCCGTC TCCCCCGCCG TGGTGCACGG CATGCTCGCC 
GGGGTGGGCG TGACCATCGC CCTGGCCCAG CTGCACGTGG TCCTGGGCGG GGAACCGCAG 
AGCTCGGCGG TGGCCAACAT CGCCGACCTG CCCCACCAGA TCGCCAACAA CCACACCCCG 
GCCGTCGCGG TCGGCGTCAT CACCATCGCG ATCATGTTCA CCTGGAACAA GCTGCCCTCC 
CTCGGGCGGC TGCGGCCCGC CGTGGTGCCC GCCGCGCTGG TCGCCGTGGC CACCGCGACC 
CTCATCTCCA CCACGAGCGG CTGGCAGGTG CAGACCGTCG TCCTGCCCGG CTCCTTCGCC 
GACGCCTGGA ACGGCCCGAT GCTGCCCGAG GCCGGGCAGT GGGACGGCAT CGCCCTGAGC 
GTGGCCGCCG TGGCCATGGT CGCCAGCGTC GAGTCCCTGC TCGCCGCGAT CGCCGTGGAC 
CGCATGCACA GCGGCCGCCG GGTGATGCTC AACCGCGAGC TGTGCGGCCA GGGCGCGGCC 
AACACCATCA GCGGCGCCCT GGGCGGGCTG CCGGTGGCCG GTGTGATCGT GCGCAGCACC 
ACCAACGTGC GCGCCGGGGC GCGCAGCCCG CTCTCGACCA TCCTGCACGG CGTGTGGATC 
CTGCTGTTCG TCGCCCTGTT CGCGCACGTG GTCGAGCTGA TCCCGATGCC CGCGCTCGCG 
GCGCTGCTGG TGTTCATCGG CGTGCAGATG GTCTCGATCG CCCACCTGCG CGACCTGCGC 
CGCCACCACG AGGCCAGCGT CTACCTGGTG ACCCTGTTCG GCGTGGTGTT CCTGGGGCTC 
CTGGAGGGCG TGTTCATCGG CTTCGCGCTG GCCATGATCG TCTCCCTGCG CAGGCTCACC 
AAGCTGACCG TGACCACCGA GGAACGCGAC GACCGGGTGC ACATCACCGT GCACGGCTCG 
CTCACCTTCC TGGGCGTGCC CCGGCTCGCG CACGTGCTGC GCACCGTCCC CTCGGGCTCA 
CGGGTCGACC TGGACCTGCA CGTGGACTTC ATGGACCACG CCGCCTTCGA GGCCATCCAC 
GCCTGGCGGG TGGACCACGA GCGCACCGGC GGCAGCGTCG ACATCGACGA GGTGCACGAG 
AAGTGGTACA CGCGCAGTTC CACCCGGTCG GCGCCCGCCG CCAAGACCGC GCCCGGCGGC 
CTGGCCCGCT GGTGGGCCCC CTGGGAGATG CGCGGTGACG GCGACCGCGG GGTGAACGCG 
CTGGGCCTGC TGACGGCCGG CGCCCGCGAG TACCACGCCA GCACCACCGA CCGGATGCGG 
TCGGTGATGA GCCGCCTGTC GCACGGCCAG AACCCGACCG CGCTGTTCGT CACCTGCGCC 
GACTCGCGCG TGGTGCCCAA CCTCATCACC GCGAGCGGGC CCGGCGACCT GTTCACCGTG 
CGCAACCTCG GCAACCTGGT GCCGCCGCGG GAGGCCCCCG ACAACGGTTC GACGGGCGCG 
GCGATCGAGT ACGCGGTGAA CGTGCTGCGG GTGCCCTCGA TCGTGGTGTG CGGACACTCG 
CACTGCGGGG CGATGCAGGC CCTGCTGGAG AAGGCCCACC TGGAGACGGA CGAACAGGCG 
TCGCACATGC GCCGCTGGCT GTCACACGGC TCGGAGAGCC TGGCGCGGGT GGGCGAGGAG 
TCGGGCGCCC TGTCGGGCCT GCCCACGGCT GAGGCGCTGC GCCGCCTGGC CCAGGCCAAC 
GTGGAGGCGC AGATCGGCAA CCTCGCGAGC TACCCGGTGG TCCGCGAACG GGTGGAGGCG 
GGCGAGCTGA CGCTGACGGG GATGTACTAC GACCTGGAGA CGGCGAGGGT GCACCTCCTG 
GACGCCGAGA GGGGGGAGTT CGTCCCCGTG CAGGGCGTCC AGGACGTGAA CGACCCCGTG 
CCCCACCCGA GGACGGATGC GGACCACGGG GATCAGCTGG TGGAGGAGTC CTCGTCGGGC 
GCGTCGTCGC GTCCGTCCTG CTGA

Protein sequence

MRNDAQGVTP ERPPTASPGQ RFDRHRGIAA DVGASLVVFL VAVPLSLGIA VASGAPLIAG 
IIAAVVGGIV AGLVGGSVVQ VSGPAAGLTI IVADLVMTYG WRVTCLITLL AGLVQLALGA 
FRIARAALAV SPAVVHGMLA GVGVTIALAQ LHVVLGGEPQ SSAVANIADL PHQIANNHTP 
AVAVGVITIA IMFTWNKLPS LGRLRPAVVP AALVAVATAT LISTTSGWQV QTVVLPGSFA 
DAWNGPMLPE AGQWDGIALS VAAVAMVASV ESLLAAIAVD RMHSGRRVML NRELCGQGAA 
NTISGALGGL PVAGVIVRST TNVRAGARSP LSTILHGVWI LLFVALFAHV VELIPMPALA 
ALLVFIGVQM VSIAHLRDLR RHHEASVYLV TLFGVVFLGL LEGVFIGFAL AMIVSLRRLT 
KLTVTTEERD DRVHITVHGS LTFLGVPRLA HVLRTVPSGS RVDLDLHVDF MDHAAFEAIH 
AWRVDHERTG GSVDIDEVHE KWYTRSSTRS APAAKTAPGG LARWWAPWEM RGDGDRGVNA 
LGLLTAGARE YHASTTDRMR SVMSRLSHGQ NPTALFVTCA DSRVVPNLIT ASGPGDLFTV 
RNLGNLVPPR EAPDNGSTGA AIEYAVNVLR VPSIVVCGHS HCGAMQALLE KAHLETDEQA 
SHMRRWLSHG SESLARVGEE SGALSGLPTA EALRRLAQAN VEAQIGNLAS YPVVRERVEA 
GELTLTGMYY DLETARVHLL DAERGEFVPV QGVQDVNDPV PHPRTDADHG DQLVEESSSG 
ASSRPSC