Gene Ndas_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1984
Symbol
ID	9245834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2405150
End bp	2406187
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	76%
IMG OID
Product	aminotransferase class V
Protein accession	YP_003679916
Protein GI	297560942
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.817831
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000368323
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGACA CCATCACCGA CCTGTGGAGC ACCGACACCG TCTGGCTCAA CACCGCCCAG 
TACGGCATCC CGCCCCGGCC CGCCCACCAG GCCCTGGCCG ACGCCGTGCG CTCCTGGCAC 
ACCGCCACCG GGAACCCCGC GGCCTGGGGG CGCGAACTCG AACAGGCCCG CGTCAACCTC 
GCCGCCCTGG TGGGCGCGCC CGCCGACGAC CTCACCCTGG GCGCCAGCAC CGCCCAGATC 
GCCGGGACCA TCGCCGCCAG CCTGCCCGAC GGCGCCCGCG TCCTGGTTCC CGAGGGGGAC 
TTCGCCTCGA TCGTCTTCCC CTGGCAGGCC CAGGCCGACC GCGGCGTCAC CGTGGAGGCC 
GTCCCCCTGG ACCGCCTGGC CCAGGCCGTG GACGCGCGCA CGCACCTGGT CGCCTTCAGC 
ACGGTGCACT CGGCGAACGG ACGCCTGGCC CCCACCGGCG ACATCGTCGC GGCCGCCCGC 
GCCCACGGCG CCCTGGTCGT GGCCGACGCC ACCCAGGCCG CCGGATGGAC CCCCCTGGAC 
GCCACCGTCT TCGACGCCCT GATCGCCTCG GCCTACAAGT GGCTCATGGC GCCGCGCGGC 
CTGGCCCTGG CCTACCTGTC CCCCGGCCTG CGCGCGCGGC TGCGCCCCAA CAACGCCGGC 
CCGGCCGCCG CCCGCGACAC CGCCTCGGCG ATGTACGCCG CCCGGATGGA CCCGGCGCCG 
ACCGCCCGCG CCTTCGACAC CTCGCCCAAC TGGTTCGCGG CCGTGGCGGC CGCAGCCTCC 
AGCCGGGTCC TGCTGGAGGC GGGCCTGGAG AGGGTGCGCG CCCACAACAC CGCCCTGACC 
GACCACTTCC GCGCGGCGCT GGGGCAGGAG CCCGCGCACT CGGCCATCAC CAGCGTCGAC 
CTGCCCGGCG CCTCCGAGCG CCTGGCCCGG GCCGGGGTGG TGACCACCGA GCGCGGGGGC 
CGCACCCGCC TGTCCTTCCA CCTGTACAAC ACCCTCGACG ACGCCGAGCG CGCCGCCAAG 
GCCCTGCTCC AGCCCTAA

Protein sequence

MDDTITDLWS TDTVWLNTAQ YGIPPRPAHQ ALADAVRSWH TATGNPAAWG RELEQARVNL 
AALVGAPADD LTLGASTAQI AGTIAASLPD GARVLVPEGD FASIVFPWQA QADRGVTVEA 
VPLDRLAQAV DARTHLVAFS TVHSANGRLA PTGDIVAAAR AHGALVVADA TQAAGWTPLD 
ATVFDALIAS AYKWLMAPRG LALAYLSPGL RARLRPNNAG PAAARDTASA MYAARMDPAP 
TARAFDTSPN WFAAVAAAAS SRVLLEAGLE RVRAHNTALT DHFRAALGQE PAHSAITSVD 
LPGASERLAR AGVVTTERGG RTRLSFHLYN TLDDAERAAK ALLQP