Gene Ndas_3860 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3860
Symbol
ID	9247731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4632260
End bp	4633441
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	71%
IMG OID
Product	protein serine/threonine phosphatase
Protein accession	YP_003681763
Protein GI	297562789
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.758933
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACAGAT ACGAGACCGT AGCGCGGTCC CTCCGCGAGG CCCAGCCGCA CGGGCTCATG 
GCGGTCCTCC GTGGGGCTCT CTCCGAGGAC TACGCGGCGG TGTCCGCCGA ACTCTTCCTC 
GCTGACTACG GACTCAAGGT ACTCTGCCAC GTCCCCGATC CGCCCGGGGA GTGCGCGGGG 
GAGTACTCCG TCTTCAACAG TGTCGTGGGC AGGGTCTTCG GCGCTCAGGA GACCTTCGTC 
GAGGACAGCT TCGGCTCCGA GGCCGTCACC GTTCACCTTC CGGTGAGCGC CCGCGGCGAC 
CGCCTGGGCG TGCTCACCGT CGAACTGAAG GCGGCCGACT ACTCCGCCGG GGTGCTCGCC 
GAACTGGGGC AGGTCGCCAG CCTGCTGGGC CACGAGATCC TCGTCGCCGA GCGCGACACC 
GACGTCTACC GGACGCTGCG CCGCAGGGAC CGCCTCACCC TGGCCGCCGA GGTCCAGTGG 
GACCTGCTGC CGGGCCGGGG ATTCGAGTGC CCCGAGTACA GCATCGGCGC CCAGCTGGAG 
CCGGCCTACT CCATACGCGG CGACAACTTC GACTGGTCGG CCGCGCCGGA CCGGCTCACC 
CTGGGCATCA CCAACGGCAT GGGCGAGGGC ATCGACGCCT CGCTGCTGAC CAGCCTGGCG 
GTCAACGCCC TGCGCAACGC CCGCCGCAGC GGGATCCCGC TGGCCGACCA GGTCGCCCTC 
GCCGACAAGG CCGTCTACGC CCACTACCGG GGAGAGCGCT ACCTGGACGT CCTCCTGCTC 
GGCTTCGACC TGGCCACCGG CGAGGTGCAG GCGGTCGACG CGGGCTCGCC CCTCCTCTAC 
CGCCTGCGCG GCGACCGCGT CGAGCAGCTG CCCTTCGAGG CCCAGCTGCC CATGGGCATG 
GCCGAGGACA CCGTCTACAC CGCGGAGCGC TTCCGGGTCG AGCCGGGCGA CCGGCTGGTG 
TTCGTCAGCG ACGGCGTGTT CGACGCCAAG GGGCCGTCCG AGGAGGAGAC CTTCGGCAGC 
CGGGCACTGT CCCTGGCCAT CCTGGCCACC AGGCTGGTGC CCAGCGCCTC CGTCCCCCAG 
GAGGTCCTGC GCCACCTGGC CGAGTACCGC GGTGAGCACG AGTCCGTCGA CGACGCGCTG 
GTGGTATGCC TGGACTGGCG GGGCCGGAGC GAGCCGGAGT AG

Protein sequence

MNRYETVARS LREAQPHGLM AVLRGALSED YAAVSAELFL ADYGLKVLCH VPDPPGECAG 
EYSVFNSVVG RVFGAQETFV EDSFGSEAVT VHLPVSARGD RLGVLTVELK AADYSAGVLA 
ELGQVASLLG HEILVAERDT DVYRTLRRRD RLTLAAEVQW DLLPGRGFEC PEYSIGAQLE 
PAYSIRGDNF DWSAAPDRLT LGITNGMGEG IDASLLTSLA VNALRNARRS GIPLADQVAL 
ADKAVYAHYR GERYLDVLLL GFDLATGEVQ AVDAGSPLLY RLRGDRVEQL PFEAQLPMGM 
AEDTVYTAER FRVEPGDRLV FVSDGVFDAK GPSEEETFGS RALSLAILAT RLVPSASVPQ 
EVLRHLAEYR GEHESVDDAL VVCLDWRGRS EPE