Gene Cthe_1312 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1312
Symbol
ID	4809452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1595498
End bp	1596886
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	42%
IMG OID	640106736
Product	glycyl-tRNA synthetase
Protein accession	YP_001037737
Protein GI	125973827
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0423] Glycyl-tRNA synthetase (class II)
TIGRFAM ID	[TIGR00389] glycyl-tRNA synthetase, dimeric type

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00852036
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGTAA AAAAGACAAT GGAGAAGATT GTAGCCCTGG CTAAAAACCG AGGATTTATT 
TATCCCGGCT CTGAAATATA CGGCGGTTTG GCAAATTCAT GGGATTACGG ACCTCTTGGA 
GTGGAGCTTA AAAACAATAT AAAAAAGGCA TGGTGGAAGA AATTTGTTCA GGAAAACCCT 
TACAATGTGG GTGTTGACTG TGCAATACTC ATGAATCCTC AGGTGTGGGT TGCATCGGGA 
CATGTAGGCG GTTTCAGCGA CCCCCTGATT GACTGTAAAG AATGTAAAAC ACGTCACAGG 
GCGGACAAAA TGATAGAGGA ATGGAATCTT AAAAACAATG AAAATGTCAA GGTTGACGGC 
TGGTCCAATG AAATGCTTAT GAATTATATC AGGGAAAAGG GTGTAACCTG TCCTGAGTGT 
GGCGGAAAAA ACTTTACCGA TATCAGGAAG TTTAACCTTA TGTTTAAAAC TTTCCAGGGA 
GTGACTGAGG ATTCCAAATC CGAGATATAT TTAAGGCCGG AAACAGCCCA GGGTATATTT 
GTGAACTTTA AAAATGTTCA GAGAACAACA AGAAAAAAGA TACCCTTTGG TATTGGACAG 
ATAGGAAAGT CTTTCAGAAA CGAAATAACT CCCGGAAACT TTATTTTCAG AACCCGTGAG 
TTTGAACAAA TGGAGCTGGA GTTTTTCTGT GAGCCGGGAA CAGACCTTGA GTGGTTTGAA 
TACTGGAAGA ATTTCTGCTT CAACTGGTTA TTGAGCCTAA ACATTAAAAA GGAAAACCTG 
AGGATGCGTG ACCATTCAAA GGAGGAACTG TCCCACTACA GCAATGCCAC AACCGATATT 
GAATACCTGT TCCCGTTTGG CTGGGGAGAG CTGTGGGGAA TTGCAGACAG AACCGACTTT 
GACTTAAGAC AGCATGCAGA GCATTCGAAA GAGGATTTGT CCTACTTTGA CCCGAACACC 
AATAGAAAAT ACATACCGTA CTGTATTGAA CCGTCTCTCG GTGCAGACAG AGTTGCTTTG 
GTTTTCCTCT GCGATGCGTA TGACGAGGAA GAAGTGGAAG AAGGGGATAT AAGGGTTGTG 
CTGCGCTTCC ATCCTGCCAT AGCGCCGGTA AAAATAGCTG TGCTTCCTCT TTCTAAAAAG 
CTTGGAGATG AGGCATATAA GATTTATGAA ATGCTCATTA AAAAATACAA CTGTGAATAT 
GATGAGACAG GAAGTATAGG AAAGAGATAC AGAAGACAGG ATGAGATAGG CACACCTTAT 
TGCGTAACCT TTGACTTTGA TTCCCTGAAC GACAGGTGTG TTACCGTAAG AGACAGAGAC 
TCCATGCAGC AGGTTAGGAT TAAAATTGAC GAACTACTTT CGTATTTTGA AGGGAAATTT 
GATTTCTAA

Protein sequence

MEVKKTMEKI VALAKNRGFI YPGSEIYGGL ANSWDYGPLG VELKNNIKKA WWKKFVQENP 
YNVGVDCAIL MNPQVWVASG HVGGFSDPLI DCKECKTRHR ADKMIEEWNL KNNENVKVDG 
WSNEMLMNYI REKGVTCPEC GGKNFTDIRK FNLMFKTFQG VTEDSKSEIY LRPETAQGIF 
VNFKNVQRTT RKKIPFGIGQ IGKSFRNEIT PGNFIFRTRE FEQMELEFFC EPGTDLEWFE 
YWKNFCFNWL LSLNIKKENL RMRDHSKEEL SHYSNATTDI EYLFPFGWGE LWGIADRTDF 
DLRQHAEHSK EDLSYFDPNT NRKYIPYCIE PSLGADRVAL VFLCDAYDEE EVEEGDIRVV 
LRFHPAIAPV KIAVLPLSKK LGDEAYKIYE MLIKKYNCEY DETGSIGKRY RRQDEIGTPY 
CVTFDFDSLN DRCVTVRDRD SMQQVRIKID ELLSYFEGKF DF