Gene Ndas_3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3874
Symbol
ID	9247745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4644821
End bp	4645873
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	75%
IMG OID
Product	hypothetical protein
Protein accession	YP_003681777
Protein GI	297562803
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACT TGCGCGGCAA CCAGGCCGTG TGGCGGTTCG ACGGTGAGAC GGTCGCGATC 
AGGTACGAGG CCCAGGGCTG GTTCAAGGAC CCCCTGCTCA AACGGATCGG CCAGCTCGAA 
CTCCCCGTGG CCGCGATCGC CGAGGTCGAC TTCCAGCCCG GCGCGGGCCC CAGGAAGGGC 
TGGCTGCTGC AGCTGCGCCT GCACGAGCGG ACCGACCCCT ACGCGGCGGT CGGCGCGATG 
CTCAAGGAGA AGTCCCAGCC CTTCCGGCTC ACCGGCCAGG CCAGCGGCGA ACTGGTCGCC 
GAGTACCTGG CCGACCAGAT CCGGTTCGCC GCCGAGCAGA GCGGGCCGCC CGCCCCCGAC 
ACGGCCGTCC GCCTGGTGCC CCGGCTGCCC TTCCACATCC AGACCTCCGA GGGGACCGCG 
ACCCTGGACG GCTCCACCGT GCGCCTGGTC TGGTCCGGCG GTGAGGCGAG CGGGCGCAAG 
CGCAGGGCGC AGCGCCGCGA GTACGACCTC TCCGAGATCA CCGGGGTGGA CTGGGCGCCC 
TCCGACGGCT GGGAGTGGGG CTACATGCGC CTGGTCACCG CCGACACCGG CGGCAGGGAC 
ACCGGCAAAC CCAAGCAGGA CCTGCACGCC CTCGTCGCCG AGGAGGGGGC GGAGGGCTAC 
GACACCCTGC TCATGGCCGC GGCGGTCACC GCCCACGTGT GGGCCGCGGA GGCGTCGGGG 
GCCGGCGGCC GGGAGGGGCG CGGCGTCGCC GCCAGGCTCA GGGACCCGCG GTGGTGGCTG 
GACGCGGCGG CGCGCTCGAC CGACCAGCTG CGGGCCCTGT CCGCGGGGTC CGCGGCTCCG 
GACGCGGGGG AGGGCGCCGG ACCCGGAGCC GGACCGGGGG CCGGGGCGGC CTCCCCGCAG 
CAGGCCCTGG ACGCCGCGGG GAAGGCGGAC GGCCGACCCG ACAACGAGTG GATCTTCCAG 
CAGATCGAGC GCCTGGGAGA ACTGCACGCC AGGGGACTGC TCACCGACGA GGAGTTCTCC 
GCCAAGAAGG CCGAGCTGCT CGGCCGGATC TGA

Protein sequence

MDDLRGNQAV WRFDGETVAI RYEAQGWFKD PLLKRIGQLE LPVAAIAEVD FQPGAGPRKG 
WLLQLRLHER TDPYAAVGAM LKEKSQPFRL TGQASGELVA EYLADQIRFA AEQSGPPAPD 
TAVRLVPRLP FHIQTSEGTA TLDGSTVRLV WSGGEASGRK RRAQRREYDL SEITGVDWAP 
SDGWEWGYMR LVTADTGGRD TGKPKQDLHA LVAEEGAEGY DTLLMAAAVT AHVWAAEASG 
AGGREGRGVA ARLRDPRWWL DAAARSTDQL RALSAGSAAP DAGEGAGPGA GPGAGAASPQ 
QALDAAGKAD GRPDNEWIFQ QIERLGELHA RGLLTDEEFS AKKAELLGRI