Gene Ndas_5106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5106
Symbol
ID	9248998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	252896
End bp	253945
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	74%
IMG OID
Product	adenosine deaminase
Protein accession	YP_003682993
Protein GI	297564020
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.582125
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.494241
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGACAC CGACCAGCGC CCGCCGGTTG GACCGGCTGC CCAAAGCACA CCTGCACCTG 
CACTTCACCG GATCGATGCG CCATCCCACC CTGGTGGAGC TGGCCGCCGA GCACGGCATC 
CACCTCCCCC AGGCCCTGGT CGAGGAGTGG CCGCCCAGGC TCCGCGCCAC GGACGAGCGC 
GGCTGGTTCC GCTTCCAGCG CCTGTACGAC ATCGCCCGGT CGGTGCTGCG CAGACCCGAG 
GACGTGTACC GGCTGCTGCG CGAGGCGGCC GAGGACGAGC GCGCGGCCGG GTCCGGCTGG 
CTGGAGATCC AGGTGGACCC GAGCGGTTAC GCGTCGCTCT TCGACGGGCT CACCGCCACC 
CTGGAGCTGT TCCTGGACGC GGCCCGCGCC GCCGAGCGCG AGACCGGCGT GCACGTCGGC 
CTGATGGTGG CGGCCAACCG CACCAGGCAC CCGCTGGACG CCAAGGTGCT GGCCCGCCTG 
GCCCGCCAGT ATGCGGGCAG GGGCGTGGTG TCGTTCGGCC TGAACAACGA CGAGCGGCGT 
GGCCGCGCCC TGGAGTTCGA GGGGGCGTTC CGGATCGCGC GGCGGGCCGG GCTGCTCTCC 
GCTCCGCACG GCGGCGAGCT CCAGGGACCC CGCAGCGTGC GCGAGTGCCT GGACGTGCTG 
GACGCCGACC GGATCGGGCA CGGTGTGCGG GCCGTGGAGG ACCCGCGGCT GGTGGAGCGG 
ATCGCCGAAC GCGGGGTGAC CCTGGAGGTC TGCCCGACCT CCAACGTGGG CCTGGGGGTG 
TACGACGACC TGGGGCAGCT GCCGCTGCGC ACGCTCTTCG ACGCCGGGGT TCCGGTCGCT 
CTGGGCACCG ACGACCCGCT GCTGTTCGGA CCGCGCCTGG TGGAGCAGTA CCGGATCGCC 
CGCGAGGTGC TCGGGTTCTC CGACCCGGAG CTGGCCGAGC TGGCGCGGAT GTCGGTCCGC 
GGCTCGGGCG CGCCGGAGTC GCTGCGCAAG GAGCTGCTGG CCGGGGTGGA CGCGTGGCTG 
GCCGCCGACC CGGAGCCCGT CGGGGACTGA

Protein sequence

METPTSARRL DRLPKAHLHL HFTGSMRHPT LVELAAEHGI HLPQALVEEW PPRLRATDER 
GWFRFQRLYD IARSVLRRPE DVYRLLREAA EDERAAGSGW LEIQVDPSGY ASLFDGLTAT 
LELFLDAARA AERETGVHVG LMVAANRTRH PLDAKVLARL ARQYAGRGVV SFGLNNDERR 
GRALEFEGAF RIARRAGLLS APHGGELQGP RSVRECLDVL DADRIGHGVR AVEDPRLVER 
IAERGVTLEV CPTSNVGLGV YDDLGQLPLR TLFDAGVPVA LGTDDPLLFG PRLVEQYRIA 
REVLGFSDPE LAELARMSVR GSGAPESLRK ELLAGVDAWL AADPEPVGD