Gene Tpau_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_1950
Symbol
ID	9156105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	2036713
End bp	2038038
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	70%
IMG OID
Product	histidyl-tRNA synthetase
Protein accession	YP_003646901
Protein GI	296139658
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGCCG GAAGCTTCCA GGCTCCCAAG GGCATCCCCG ACTACATCCC GGTCCCGTCC 
GGCGAGAAGA ACAGCTCGGC TGATTTCCTC GCGGTGCGCA CGGCGCTGCT GCGCGCTATC 
GCGGATGCCG GCTACGGCTA CATCGAGCTG CCGATCTTCG AGGACACCTC CCTGTTCGCG 
CGCGGCGTCG GTGAGTCGAC CGATGTGGTG GCCAAGGAGA TGTACACCTT CGCCGACCGC 
GGCGACCGCT CCGTGACGCT GCGCCCGGAG GGGACGGCCG GTGTGGTCCG CGCGGTCCTG 
CAACACGGCC TGGATCGGGG CCAACTGCCG GTCAAGGCGG CCTACGCCGG TCCGTTCTTC 
CGCTACGAGC GTCCACAGGA GGGCCGGTAC CGGCAGCTTC AGCAGGTGGG CATCGAGGCG 
ATCGGCGTGG ACGATCCCGC ACTCGATGCC GAGGTGATCG CCGTGGCCGA CCGCGCCTAT 
CGCAGCGTCG GTCTCGACGG GTTCCGCCTG GAGGTCTCCA GCCTGGGTGA CGAGACCTGC 
CGCCCGCAGT ACCGGGAGAA GTTGCAGGAG TTCCTGTTCG CGCTCGACCT CGATGAGGAG 
ACCCGTCGGC GTGCCGAGAT CAATCCGCTC CGCGTGCTCG ACGACAAGCG GCCCGAGGTG 
AAGGCCATGA CGGCCGATGC ACCCCTCATG ATCGACAACC TCACCCCGGA GCCCAAGGAG 
CACTTCGAGA AGGTGCTCGG CTACCTCGAC GCGCTCGGGG TGCCCTATGT GGTGAATCCG 
CGCCTGGTCC GCGGCCTCGA TTACTACACC AAGACCTGTT TCGAGTTCGT GCACGACGGT 
CTCGGCGCCC AGTCGGGAAT CGGCGGCGGC GGCCGCTACG ACGGCCTGGT CGAGCAGCTG 
GGCGGCCGCG AGGGCGTGAC CGGCGTCGGA TTCGGACTCG GCGTCGACCG CACGCTGCTG 
GCGTTGGCCG CCGAGGGCAA GCGCGCACCG GCGGCGCCTC GCGTGGTGGC CTTCGGCGTC 
CCGCTGGGCG ACGACGCCCG GGATGCGATG GTCCCGCTCC TCGGACGGCT CCGCGCGCTC 
GGTGTGCCCT CCGATATGGC CTACGGCAAC CGCGCGATGA AGGGCGCGAT GAAGGCCGCC 
GACCGTTCCG GTGCCCGATT CGCCCTGATC CTGGGCGATT CCGAGCTGGC CGACGGCGTG 
GTGATGCTCA AGGATCTGGC GAACGGCGAG CAGCGGGCGG TGCCGCTCGA TACCGTGGCG 
GGCGTGATCG CCTCCGCGAA CGACGTGAAC GGTGCCGACG GCGCGAGCGC GCGGAGCGCG 
GGGTAA

Protein sequence

MSAGSFQAPK GIPDYIPVPS GEKNSSADFL AVRTALLRAI ADAGYGYIEL PIFEDTSLFA 
RGVGESTDVV AKEMYTFADR GDRSVTLRPE GTAGVVRAVL QHGLDRGQLP VKAAYAGPFF 
RYERPQEGRY RQLQQVGIEA IGVDDPALDA EVIAVADRAY RSVGLDGFRL EVSSLGDETC 
RPQYREKLQE FLFALDLDEE TRRRAEINPL RVLDDKRPEV KAMTADAPLM IDNLTPEPKE 
HFEKVLGYLD ALGVPYVVNP RLVRGLDYYT KTCFEFVHDG LGAQSGIGGG GRYDGLVEQL 
GGREGVTGVG FGLGVDRTLL ALAAEGKRAP AAPRVVAFGV PLGDDARDAM VPLLGRLRAL 
GVPSDMAYGN RAMKGAMKAA DRSGARFALI LGDSELADGV VMLKDLANGE QRAVPLDTVA 
GVIASANDVN GADGASARSA G