Gene Clim_0152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0152
Symbol	pheS
ID	6356122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	169656
End bp	170681
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	52%
IMG OID	642667779
Product	phenylalanyl-tRNA synthetase subunit alpha
Protein accession	YP_001942230
Protein GI	189345701
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0016] Phenylalanyl-tRNA synthetase alpha subunit
TIGRFAM ID	[TIGR00468] phenylalanyl-tRNA synthetase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00308868
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGAAG CCATTCGCAG TCTGCAGCAG GAAATATCTG ACTTCGGGAT CCAAAGCAAT 
AAGGATCTCG AAGCGTTCAG ACTTAAATAT ACTGTTCGCA AAGGCCTCAT TGCCGATCTT 
TTCGGACAGC TTAAAACGGT TGCTCCGGAT GAACGGCCAC GAATAGGCCA ACTGCTCAAT 
ACGCTCAAAA AAAATGCCGA CGAAAAGCAG ACGGCAGCAG AAGCTGTCTT CTCGGCACAA 
GCCGCCCGAA AAGCTCCCGC TCTTGATCTT ACCCTGCCGG GAAGACGGCA TTACACCGGC 
AGCGAACATC CAGTGCAGAA GGTACTGGGC GACATGAAGC AGATCTTTCA CGCAATGGGC 
TTCAGCATTG CAACCGGACC GGAACTTGAG CTCGACCGGT ATAACTTCGA CCTGCTGAAC 
TTTCCGCCTG ACCATCCCGC TCGTGATATG CAGGATACCT TTTTTATCAC AAGGGGCAAC 
CCTTCCGGCG ATGTGCTGCT GAGAACCCAC ACCTCGCCTG TACAGGTAAG GGTCATGCTC 
GACAACCCTC CGCCCATACG CGTCATCTGC CCCGGTAAAG TCTATCGAAA CGAAGCCATC 
AGCTCCCGGA GCTATTGCGT CTTCCATCAG CTTGAAGGGC TCTATATCGA TAAAAATGTC 
TCTTTTGCCG ATCTGAAAGC CACGATCTTT TCATTTGCCC GACAGATGTT CGGCAAAGAT 
GTTAAACTCC GTTTCAGACC GAGCTTTTTC CCCTTTACCG AACCCTCTGC CGAGGTCGAT 
GTAACCTGCT ACCTCTGTGG GGGAAAAGGG TGCCGCGTCT GCAAGAAATC GGGATGGCTG 
GAAATAATGG GTTGCGGCAT GGTACATCCG AACGTCATGC GCGACTGCGG TATCGATCCT 
GAAGTCTGGT CCGGTTACGC TTTCGGCATG GGTGTTGACC GGACGGTACT GCTCCGTTAT 
AAAATAGACG ATATTCGCCT TCTTTTCGAA AACGATATCC GCATGCTTCG CCAGTTCCCG 
GCCTGA

Protein sequence

MEEAIRSLQQ EISDFGIQSN KDLEAFRLKY TVRKGLIADL FGQLKTVAPD ERPRIGQLLN 
TLKKNADEKQ TAAEAVFSAQ AARKAPALDL TLPGRRHYTG SEHPVQKVLG DMKQIFHAMG 
FSIATGPELE LDRYNFDLLN FPPDHPARDM QDTFFITRGN PSGDVLLRTH TSPVQVRVML 
DNPPPIRVIC PGKVYRNEAI SSRSYCVFHQ LEGLYIDKNV SFADLKATIF SFARQMFGKD 
VKLRFRPSFF PFTEPSAEVD VTCYLCGGKG CRVCKKSGWL EIMGCGMVHP NVMRDCGIDP 
EVWSGYAFGM GVDRTVLLRY KIDDIRLLFE NDIRMLRQFP A