Gene Ndas_4354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4354
Symbol
ID	9248229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5188605
End bp	5189747
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	72%
IMG OID
Product	hypothetical protein
Protein accession	YP_003682249
Protein GI	297563275
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.501601
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGACGG TAGGACTGGC ATTCATAAGC GCGTTGGTGG GCTGGGGCGC CACCGCCGCG 
CTCGCCGCGT ACGCCCAGCG CCGTCCCAGT GTGGCCACGG TCGGATGGCT CGTCGCCGCA 
CTGGGTACGA CGGTCGGCCT CAGCGCGGCC GTGATCGGCG CGATGTTCGA CTTCGGCGGG 
ATCACCTTCC GGCTGCTGCA TATCGGCATC AGCCTCCTGG GCCCGCTCTA CATGGCCTGG 
GGCGCGCTGG AGTACGGCGT CCGCTCGCCC CGCGGCCGGT TCACCTCGCG GCTGTTCCTC 
AGCGCGTTCA CCATCGTCCC CCTGGTGGTG CTGTCCGTCG ACCGGGTGGG CACCCGTTTC 
GACGCCTCCT ACCCCGCCAT GGGCGACCAC TACGACCTCA TCCCGCGCTC GCTCGTCAAC 
CTCGCGCAGG TCCTCGTCGC GGTCTTCCTC GTCACGGCGC TCGTCGCGGT CGCCCGGCGC 
GCCTCCGACC ACCGCAGCAC CGACCTGACG GTGCTGGGGC TGGTCGGCTT GGCCGCGCTG 
CTCTCCGTCG TGGTCGGCCG CTTCGGACTC GGCTTCGGGG GGCCGCTGCT GATGCTCGGC 
TCCGTCGCCG CGCTGTGGGG GGCCGTCGCC ATGGCCGCGC GCCCGCGCCG CGACCCCTAC 
GACGATGACG ACTACTACGA CGACTACGAC GACGGGGGCG CGGACCCCGA CGACGAACTC 
CCGGAGGAGC CCGTGCGCCG CAAGCGTCGC CAAGCCGACC CCTACGACGA CTACTACGAC 
GGTCCGCCGG TCCGCCAGGC GCCGCCCAGC AAACTGCGCG GCGTCATCAC CATCTACACG 
CTCGCCGACG GCCAGGGCCC GGGTTTCGAC CGCATCGCCG ACGCCCTCGT CGCCCAGGTC 
TCCCACAGCG AGCCGGACAC CCTGCTGTTC GCCTGCCACA CGGTGCCCAG CGCGCCGCTC 
CAGCGCATCG TCTACGCGAT GTACCGCGAC GAGCTGGCGC AGGAGGAGCA CGAGCAGCAG 
CCGCACGTCC TGGAGTTCGC CCGCCTCAGC CCCCAGCACG TGGTCGCCAC CAACGTGATC 
GAACTCTCCC TCGCGGGCGC GGCGGCCAGC GACGGCCTCG CCGCCATGCT GATGCCCCGC 
TGA

Protein sequence

MVTVGLAFIS ALVGWGATAA LAAYAQRRPS VATVGWLVAA LGTTVGLSAA VIGAMFDFGG 
ITFRLLHIGI SLLGPLYMAW GALEYGVRSP RGRFTSRLFL SAFTIVPLVV LSVDRVGTRF 
DASYPAMGDH YDLIPRSLVN LAQVLVAVFL VTALVAVARR ASDHRSTDLT VLGLVGLAAL 
LSVVVGRFGL GFGGPLLMLG SVAALWGAVA MAARPRRDPY DDDDYYDDYD DGGADPDDEL 
PEEPVRRKRR QADPYDDYYD GPPVRQAPPS KLRGVITIYT LADGQGPGFD RIADALVAQV 
SHSEPDTLLF ACHTVPSAPL QRIVYAMYRD ELAQEEHEQQ PHVLEFARLS PQHVVATNVI 
ELSLAGAAAS DGLAAMLMPR