Gene Tpau_3599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3599
Symbol
ID	9157778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	3711238
End bp	3712395
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	67%
IMG OID
Product	hypothetical protein
Protein accession	YP_003648516
Protein GI	296141273
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.904243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACTCCG AACCGCTCAC CTCGGCGATC GCCGAGGCCG AGGCTCTCGT CGCCGCCGCT 
GCGCACATCG AATCCGAGGC CGATCTCCTG GAAGGCCTGC AGTACCTGGC GCAGGGCGTG 
GCCGCGTGCA TTCATGGCGC CTTCCATTTC GACAAGGACC ACCCGTTCCT GCTCAGCGGC 
ACCGGACCGT TCACCAAGAT GGGGCTCGAC AATCCCGACA CCCTGTACTT CGGTGCACGC 
GTGGACGGTT CCCACGAGTA CCTGGTCACC GGCCGTCGCG GTACCACCGC AGACATCAGC 
TTCCAGGTAC TCGGAGGCGG CGAATACACC GACGAGAACG TGCCCGCCAG CACCGTCGCC 
TTCGACGACC GCGAGCTCAC CATCGGCGCC GACGGCCGGT TCGCGGTGCG ATTCGGGCCC 
GGCCGAGCCG GGCCGGACTA CTACCACCTG CCACCGGGTA AGGCACAACT GGTGATCCGC 
GAAGTCTTCG ACGACTGGTC GGCCCAGCGC AGTACTTTCG CGATCACTCG CACCGACACC 
ACCGGTACCG CCCCGCCGCC GCTCACCGAC GAGCTCATTC GCAAGCGCTA CGCCGCCGCG 
GGCACCCAAC TGGTCAACCG CGTGAAGACC TGGCTGCAGT TCCCGCGGTG GTTCTACGAT 
CCGCTGCCGG TGAACACCCT CTCCGCGCCG CGCCTCACCC CGGGCGGCCT CGCCACCCAG 
TACTCGTCCG TGGGCCACTA CCATCTCGCC GACGACCAGG CGTTGATCAT CACCGTTCCC 
CGTGGCGACG CGCCCTACGT CGGCTTCCAG CTCGGCAGTC TCTGGTACAT CTCGTTGGAC 
TACATCAACC ACCAGACCTC GCTCAACGGC AGCCAAGCGC AGGTAGACCC GGATGGGAAC 
ATCCGGATCG TGGTCTCCGG CAAGAACCCC GGCATCACCA ACTGGATCGA GACCGTGGGA 
CACCGCCGCG GCTACCTGCA ATTCCGCTGG CAACGTACCT CCGGTCCGGT CACCGAAGGC 
CCCACCGCGC ACGTGGTCCC GCTCGACGAC GTGGCGCGGC ATCTGCCCTT CCACGCGCAG 
AACACGATCG ACGAGCACCG TTGGCGGGCG CGGATCGCGG AGCGGCAGCG CCTCATCGGT 
GAGCGGATGG TGGGCTGA

Protein sequence

MYSEPLTSAI AEAEALVAAA AHIESEADLL EGLQYLAQGV AACIHGAFHF DKDHPFLLSG 
TGPFTKMGLD NPDTLYFGAR VDGSHEYLVT GRRGTTADIS FQVLGGGEYT DENVPASTVA 
FDDRELTIGA DGRFAVRFGP GRAGPDYYHL PPGKAQLVIR EVFDDWSAQR STFAITRTDT 
TGTAPPPLTD ELIRKRYAAA GTQLVNRVKT WLQFPRWFYD PLPVNTLSAP RLTPGGLATQ 
YSSVGHYHLA DDQALIITVP RGDAPYVGFQ LGSLWYISLD YINHQTSLNG SQAQVDPDGN 
IRIVVSGKNP GITNWIETVG HRRGYLQFRW QRTSGPVTEG PTAHVVPLDD VARHLPFHAQ 
NTIDEHRWRA RIAERQRLIG ERMVG