Gene Ndas_4956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4956
Symbol
ID	9248844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	99633
End bp	101156
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	73%
IMG OID
Product	TAP domain protein
Protein accession	YP_003682844
Protein GI	297563871
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.562249
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.30314
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTCGCCG GGTCCGTGCT GCTGGCGACG GCGTGCACGG CGCAGGGCGA CCAGCCGAGG 
GAGGGAGGCG TCGCGCCCGG GCTCTCCGGG GACCTGGCGG CCTTCGCCGA CCAGGAACTG 
GCCTGGGGCG AGTGCGAGAG CGGAGCGCCC GGCACCGAGT GCGCCACCTA CGAGGTGCCC 
CTCGACTACG GGGACCCGGA CGGCGAGCGC ATCGAGATCG CGGTCAAGCG CTTCCCCTCT 
GAGGGAGGCG ACGTCCTGGG CTCCCTGCTC GTCAACCCCG GCGGGCCCGG CGGCTCCGGG 
TACGACTTCG TGGACCACGC CCCCTACACG GTCAGCGACG CGGTGCGCGA GAGGTTCGAC 
GTGGTCGGGT TCGACCCGCG CGGTGTCGGT CGCAGCTCAC CGCTGACCTG CCTGGACGCC 
GAGGGCATCG ACGAGTTCCT CGGCGGGGTG GACAGCGTCG AGGGCGACGG CGACATGTCC 
GAGGTCTCCG CGGCCGAGCT GGCCGAGCTG GAGGAGGACA GCCGCGGCTT CGTCGAGGCC 
TGCCAGGCCA ACCACCCCGA GCTGATGCGG CACGTGGGCA CCGCGGACGT GGCCCGCGAC 
ATGGATCTGC TGCGCGCCCT GCTCGGCGAC GAGAAGCTCA CCTACCTGGG CGCCTCCTAC 
GGCACCAGCA TCGGCGCCCA CTACGCCGAG CAGTTCCCCG ACCGCGTCCG CGCGCTGGTG 
CTCGACGGCG CAGTGGACCC CAGCCAGGGG CAGCTCGACC TCAGCGTGCA GCAGGCGACC 
GGGTTCGAGA CCGCCCTGCG GGCCTTCGTG GAGGACTGCC TGAGCCGGTC GGACTGCCCG 
CTCGGCGCCC CCGGCGACAG CGTGGACGAC GGCATCGGGG CGCTGACCGC CTTCCTAGCC 
GACACCGCCG AGAACCCCCT GTCCAACAGC ATGGACGACC GCGAGGTCAA CCGCGCCCGC 
GCCGAACTGG GCGTGCTCGC CGCGCTCTAC ACCGAGGACT GGTGGCCGCG CGTGCGCGAG 
GCCCTCACCG CCGGTACGGA GGGCGACGGC ACCCTTCTGC TCCAGCTCGC CGACGACCTC 
TACAGCCGGA GCGACACGGA CGCCTACGTC AACTCCACGG CCGCGCTCAT CGCGGTGAAC 
TGCTCCGACT CGCCCAGCCC GCGCGACGTG GAGGCCTACA CCGAGGCCGC GGCCCGGGCC 
GGTGAGGAGT CACCGATCTT CGGCCCCAGC CTGGCGTGGG GCGCCCTGCC CTGCGCGTAC 
TGGCCGGAGG AGGCGGTCGA CCCGCCCGTG GAGCTGGACG GGGACGGAGC CGCGCCCGTC 
ATGGTGCTGG GCACCACCCG GGACTCGGCC ACCCCGTACG CGTGGTCCGA GGCGCTCGCG 
GAGCAGCTCG ACTCGGGTTT CCTGGTGACC CGCGACGGCG ACGGACACAC CGGTTACCGG 
ATGGGCGACC AGTGCGTCGA CGCGATGGTG GACGCCTACC TGGTCGACCT CACCGTGCCC 
GAGGACGGCA TGGCCTGCGC CTGA

Protein sequence

MLAGSVLLAT ACTAQGDQPR EGGVAPGLSG DLAAFADQEL AWGECESGAP GTECATYEVP 
LDYGDPDGER IEIAVKRFPS EGGDVLGSLL VNPGGPGGSG YDFVDHAPYT VSDAVRERFD 
VVGFDPRGVG RSSPLTCLDA EGIDEFLGGV DSVEGDGDMS EVSAAELAEL EEDSRGFVEA 
CQANHPELMR HVGTADVARD MDLLRALLGD EKLTYLGASY GTSIGAHYAE QFPDRVRALV 
LDGAVDPSQG QLDLSVQQAT GFETALRAFV EDCLSRSDCP LGAPGDSVDD GIGALTAFLA 
DTAENPLSNS MDDREVNRAR AELGVLAALY TEDWWPRVRE ALTAGTEGDG TLLLQLADDL 
YSRSDTDAYV NSTAALIAVN CSDSPSPRDV EAYTEAAARA GEESPIFGPS LAWGALPCAY 
WPEEAVDPPV ELDGDGAAPV MVLGTTRDSA TPYAWSEALA EQLDSGFLVT RDGDGHTGYR 
MGDQCVDAMV DAYLVDLTVP EDGMACA