Gene Ndas_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2010
Symbol
ID	9245860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2430209
End bp	2431660
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	78%
IMG OID
Product	transcriptional regulator, GntR family with aminotransferase domain
Protein accession	YP_003679942
Protein GI	297560968
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.348528
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAGC GTAGCAGTGT GCGGGAACTG ACCGTTTTCC TGCGCAGGGA GGTCGACCGC 
TACTCCCCCG GCGAAAAGCT GCCGTCGAGT CGGGCACTGG TGGAGCGCTA CGGCGTGAGC 
CCGGTGACCG TGTCGCGGGC CGTCGCGGCG CTGGTCGCCG AGGGTGTGGT GGTCACCCGG 
CCCGGCGCCG GGGCGTTCCG GGCGGGCGGG AGCGTCCCCG GGCGCGCGGT CGGCGACACC 
TCCTGGCAGG AGGTCGCGCT GAGCGCCGAG ACGGCGGCGG CCTCCGGCGA ACCGGTCCCG 
CGCACCGTGG ACGCCTCCGG GGTGCTGGCC ACCCTGACCC CGCCCGACCT GGGGGTCGTC 
GTGTTCAACG GCGGCTACCT GCACCCCGCC CTCCAGCCCG AGCAGGCCAT GGGCGCCGCA 
CTGGCCCGGG CGGGACGGCG GCCGGGAGCC TGGGCGCGCC CGCCGGCGGA AGGAGTGGAG 
GAGCTGCGCG GCTGGTTCGC CCGGCAGATC GGCGGCTCCG TCGGCGCGGC CGACGTGCTG 
GTCACCGCGG GCGGGCAGAG CGCGCTGACC ACCGCGCTGC GCGCCCTGGC CCACCCGGGG 
GCGCCCGTTC TGGTGGAGTC GCCCACCTAC CCCGGTCTGC TGGCCGTCGC GCGTGCCGCG 
GGCCTGCGGC CCGTCCCCGT CCCGGTGGAC GCCGAGGGGA TCCGCACCGA CCTGCTGGAG 
CAGGCGTTCG CGGCCACCGG CGCCCGGGTG CTGGTGTGCC AGCCGCTCTT CCACAACCCC 
ACCGGGACGG TCCTGGCCCC CGCCCGGCGG GGCGAGGTGG TGCGGACCGC GCGCGCCGCG 
GGCGCTTTCG TGGTGGAGGA CGACTTCGCC CGCCACCTGG CGCACGCTGA CGCCGCGGCT 
CCGCCGCCCC CGCTGGCGGC CGAGGACCCC GACGGCACCG TGGTGCACGT GCGGTCGCTG 
ACCAAGGCGA CCTCGCCCAG CCTGCGCGTG GGTGCGATCG CCGCGCGGGG ACCGGTGACG 
CGGCGCCTGC GCGCGATCCA GCTGGTGGAC AGCTTCTTCG TGGCGCGCCC CCTGCAGGAG 
GCCGTGCTGG AGCTGGTCGG CTCGCCCGCG TGGGGCCGCC ACCTGCGCGC GGTGGCGGCG 
GGCCTGCGCG AGCGCCGCAC GGCCATGGCC GCGGCCCTGG CGCGTGAACT GCCGGAACTG 
GCGGCGCCGC ACCTGCCCGC GGGCGGACAC CACCTGTGGC TGCGGCTGCC CGGTGAGACC 
GACGAGGCCG CGCTCGTGTC CGCGGCGCTG CGCGCCGGGG TGGCGGTGGC CGCAGGCCAG 
GCCTACTTCC CGGCGGAGCC GACCGCCCCG CACCTGCGGC TCAGTTACGG CGGCGCGGCC 
GGGACCGCCG AGATCACCGA GGGGGTGCGC CGCCTGCGCA CCGCGTTCGC CGGTACCGCA 
CCCGGGGAGT GA

Protein sequence

MKQRSSVREL TVFLRREVDR YSPGEKLPSS RALVERYGVS PVTVSRAVAA LVAEGVVVTR 
PGAGAFRAGG SVPGRAVGDT SWQEVALSAE TAAASGEPVP RTVDASGVLA TLTPPDLGVV 
VFNGGYLHPA LQPEQAMGAA LARAGRRPGA WARPPAEGVE ELRGWFARQI GGSVGAADVL 
VTAGGQSALT TALRALAHPG APVLVESPTY PGLLAVARAA GLRPVPVPVD AEGIRTDLLE 
QAFAATGARV LVCQPLFHNP TGTVLAPARR GEVVRTARAA GAFVVEDDFA RHLAHADAAA 
PPPPLAAEDP DGTVVHVRSL TKATSPSLRV GAIAARGPVT RRLRAIQLVD SFFVARPLQE 
AVLELVGSPA WGRHLRAVAA GLRERRTAMA AALARELPEL AAPHLPAGGH HLWLRLPGET 
DEAALVSAAL RAGVAVAAGQ AYFPAEPTAP HLRLSYGGAA GTAEITEGVR RLRTAFAGTA 
PGE