Gene Ndas_5204 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5204
Symbol
ID	9249097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	-
Start bp	354506
End bp	355675
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	76%
IMG OID
Product	GAF domain protein
Protein accession	YP_003683090
Protein GI	297564117
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.412194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGAGA ACCTCGCCGG GTTGCAGCGT GAGATCACCG CACTGGGTGA ACGCATCGCG 
GCCCTGCGCA ACACGCACAC CATGTATCCC GACGACGCCC AGGGCACCGC CGAGGCGGCC 
CTGGCCGAAC TGGAGTACGC CGAACGCCTG CTGGGCGACG CGGGGGCCGA ACTGGCCCGG 
GCCCACGCCC AGCCCGAGCC GCGCCGCCAG GGCGACGACG GCGACCGGGC CCTGCTCCGC 
GCGATGTTCC AGGAGCTGAG CGTCCCCACC GTGCTGCTGG ACCACGAGGG CTACATCCGG 
CGCATCAACA ACTCCGGGGC CGCGCGGCTG GGCAGCGCGC CGGGCTACCT CACCGGCAAG 
CCCTTCGCCC ACTTCGTCGA CCTGCGCAAG CGCGCGGCCA TGCAGTCCTG GCTGGCCGCG 
GTGCTGCGCG GCGACGGCGA CGCCGCGCTG GAGTCCCGGC TGGCCCAGCG CGGCTGGGCC 
GAGGACGTGC ACCTGACCCT GACGCGCCTG GAGCTGCCCA CCGAGCCCAA CCCGCTGGTG 
CTGGTGGCGA TGTCGCCGCC GATGAACGGC GCCGAGGAGG AGGGCCCCGC CCCGCTGGAG 
ACGGAGGTGG AGGACCAGGT GGTGGTGCTG GCCGCGCGCA GGCTGGACGT GCTGACCCGG 
ATGACGCGGC TGCTGCTGCG CTCGGCCGGC CCGGGCGGTG CGGGCGAACC GCTCGCGCTC 
GCGGACGCGG CCGACCTGCT GGCCGACTCC TACGCCGACT GGGTGGTCGT GGACGTGTGC 
GACCTGCCCA CCTCCTCCGT GGCGCCCCGC CGCGCCGTGG TCGCGGGGCC GGCCGACGCG 
CTCCCGGCGC AGAGGGAGGC GGTGGCCTCG GCGGCGCCCG GCGACTCCGC CATCCCGGGC 
GAGGTGCTGG AGCGGGGCCA GTCCCTGCTG TTCCCGCTGA TCGAGGACGA GGCCGTGCTG 
GGCCACGCCC CGTCCGGAGC GCCGCTGCTG TCGATGCTGG GCGCGGGGTC GCTGTTGTCG 
GTCCCCCTGC GGGGCAGCCG GGGCGTGCGC GGCGCGCTCA CCCTGATCCG CCGCAGCAAC 
CGGGGCAGCT TCCGCCTGGC CGACCTGGGC CTGATCGAGG AGATCGGCGA GCACATCGGC 
CTGGCCCTGC CGCCCCGGCC CTCCGCCTGA

Protein sequence

MSENLAGLQR EITALGERIA ALRNTHTMYP DDAQGTAEAA LAELEYAERL LGDAGAELAR 
AHAQPEPRRQ GDDGDRALLR AMFQELSVPT VLLDHEGYIR RINNSGAARL GSAPGYLTGK 
PFAHFVDLRK RAAMQSWLAA VLRGDGDAAL ESRLAQRGWA EDVHLTLTRL ELPTEPNPLV 
LVAMSPPMNG AEEEGPAPLE TEVEDQVVVL AARRLDVLTR MTRLLLRSAG PGGAGEPLAL 
ADAADLLADS YADWVVVDVC DLPTSSVAPR RAVVAGPADA LPAQREAVAS AAPGDSAIPG 
EVLERGQSLL FPLIEDEAVL GHAPSGAPLL SMLGAGSLLS VPLRGSRGVR GALTLIRRSN 
RGSFRLADLG LIEEIGEHIG LALPPRPSA