Gene Ndas_4561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4561
Symbol
ID	9248442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	5405893
End bp	5407068
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	72%
IMG OID
Product	membrane protein
Protein accession	YP_003682454
Protein GI	297563480
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCGCCG AACGTGTGAG GAGGACCGCG GCCAACGCCC GCGAGGTGCT GCGCCGGATC 
GTCGAGCGGC GCGGCTACGA GCGCGAGACC GCGGTCATCG TCGCCAAGTG CGTCATCGCC 
TCCACCGGAG CCTGGCTCGT GGGCACCCTC CTGGAGGGCT CGTCCCAGAT CGGTTTCGCC 
CCCTTCTCCG CCCTGCTGGT GGTGCGGCCC AGCGTGTACG GGTCGGTGCT CCAGTCCCTG 
CGCTACGTCC CCGCGGTCTT CCTGGGCGCC CTGATCGCGG GCCTGACCGG GCTCACCGTC 
GGGCTCAACG TGTGGTTCTT CGCCCTGGCC GTGTTCGTCG CGATGATCGC GGGGCAGTTC 
ACGGTCTTCG GCGACCAGGG CAAGCAGATA CCCGTGGTGG CGTCGTTCGC GCTCGCGGGA 
GGTACCGCGG GCAGCCTCAC GGACATGGGA ACCCTGCTGC TCATGGTGCT GGTGGGGGCC 
GGGGCCGCGG TCGTGACGAA CACGGTCTTC GCGCCCGCCA TCCGCTTCCG CGACGCCGAG 
AGCGCCGTGT TCGACTTCGC GGACGGCCTG CGCGACCTCA GCCGGGAGAT GGCCGAGGCG 
CTCCGCGGGG GCGATGAGGG GCTCGGGGAC GTCGGCTACT GGGCGCGGGT CGCCCAGGGG 
TTCGACAACA CCGAGCGCAA CGCCCGGGAG TCGGTCTCCC AACAGGAGTA CCGGGCGCGC 
CTGAACCCGC GGCGGCTCCT GACCGGTCCC TCGCCGAAGA GGGCGCCGAA GGCCTACTAC 
GGCTGGATCC TCGCCCTGGG CCGGTCCGCG CGCCACCTCC AGTCCCTCGT CCGCACCCTG 
AGGACCGCGA AGGAGGGGCG GTCGCGCTTC CCCGAGCCGA GCGACGCCTT CCTCCGCGAG 
TTCGCCCCGC TCCTGGACGC GGCGGCGGAC GCCTTCGACG CCCTCCACGA GGCCGGGGAA 
CCCGAGCGCG ACACCGTCTC CGCCGACCTC GACTCCTGTC TGGAGGAGGG GCTCCGGCGC 
ATCGACCGGG CGCGGGAGCA CATGAGCGAG GACTGGGACT CCGAACGCTG GCCCGTGCAC 
AGCGCGCTCC TCACCGACCT GGAACGACTG TTCGAGGAGT TGCGGGAGGG GCACGAGAAC 
AGCGAGGAGG GGACGCCGGG CGCTACGGCG GGGTGA

Protein sequence

MVAERVRRTA ANAREVLRRI VERRGYERET AVIVAKCVIA STGAWLVGTL LEGSSQIGFA 
PFSALLVVRP SVYGSVLQSL RYVPAVFLGA LIAGLTGLTV GLNVWFFALA VFVAMIAGQF 
TVFGDQGKQI PVVASFALAG GTAGSLTDMG TLLLMVLVGA GAAVVTNTVF APAIRFRDAE 
SAVFDFADGL RDLSREMAEA LRGGDEGLGD VGYWARVAQG FDNTERNARE SVSQQEYRAR 
LNPRRLLTGP SPKRAPKAYY GWILALGRSA RHLQSLVRTL RTAKEGRSRF PEPSDAFLRE 
FAPLLDAAAD AFDALHEAGE PERDTVSADL DSCLEEGLRR IDRAREHMSE DWDSERWPVH 
SALLTDLERL FEELREGHEN SEEGTPGATA G