Gene Cphy_2787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2787
Symbol
ID	5742102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3392857
End bp	3394113
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	37%
IMG OID	641293878
Product	histidine--tRNA ligase
Protein accession	YP_001559886
Protein GI	160880918
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3705] ATP phosphoribosyltransferase involved in histidine biosynthesis
TIGRFAM ID	[TIGR00443] ATP phosphoribosyltransferase, regulatory subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAGAT TATTACACAC CCCAGAGGGT GTTCGTGATA TTTATAACTC TGAGTTTGCA 
AAGAAAAAGA TGCTAGAACA AGAGCTTAGT AAGCGCTTGG CACTGCATGG ATTTCATGAG 
ATACAAACCC CGATGTTTGA GTTTTTTGAT ATTTTTAGCA AAGAACGTGG AAGTGTAAGT 
GGTAAAGAGA TGTATAAGTT TTTTGATAGG GAAGGTAATA CCTTAGTACT TCGCCCAGAT 
ATCACACCAT CCATAGCACG CTGCGTTGCT AAATACTATA AGACAGAAGA GATGCCAATA 
CGTTTAAGTT ATTGTGGAAG CACTTTTATT AATAGTAGCA GTTACCAGGG GAAATTAAAG 
GAAACTACTC AGTTAGGAGC AGAATTAATT AATGATGCAA GTATAGAAGC GGATGCTGAG 
ATGATTGCAT TGACGGTAGA ATGCTTAAAA TGTGCCGGTT TAAAAGAGTT TCAAGTAGAA 
ATAGGTCAAG CTGACTTCTT TCTCGGAATT GTAGAAGAAG CAGGATTTGA TGAAGATGAA 
ACCGAACAGT TACGTATTCT GATTGAAAAT AAGAATTTAT TTGGTGTGGA AGAACTAATT 
AGTGGAAAGA AGTTAGAAAA ACCTGTAAAG AGTGTTATTT TACAGTTAAC TGACCTTTTT 
GGAACACTAG ATAAAGTACT TGGTGTGAAG GAATCCATCC ATAATGAACG TGCAAGAAAT 
GCTTTAGAGC GTATGGAAAA ACTATATGAA TTATTAACAC TCTATGGATA TGAACAGTAT 
ATCACCTTTG ATTTAGGAAT GCTTAGTAAG TACAATTACT ATACCGGAAT TATTTTCAGA 
GCTTACACCT ATGGAACCGG TGATGCGGTG ATTACTGGAG GTCGTTATGA TTCTTTGGTT 
TCGCAGTTTG GAAAGCAGGC ACCAGCGATT GGTATGGCTG TTTTAATAGA CCAACTTCTG 
ACTGCACTAA GTAGGCAAAA ACTATTAGGA GAGCCTGAAT TAGAGAATAC CTTGATTGTT 
TACGATTCTT CTTATATCGC AAATGCTGTG GCTCTTGCCA ATCATTTTCG TGGACAGGAG 
ATGAAGATTG AAATGTTGGC CCATGACGAA AGAAAAACGA GAGAGGATTA TATAGCGTAT 
GCAAATCGTA TGAGTATTGG TGGTATTCTT GCATTATTTA CCGAAGACGA GGTAGAGGTG 
ATTCATGCAA TCGATGGAAC AGTACAAACG GTACCACTCA AAGGAATGTT ATCCTAG

Protein sequence

MDRLLHTPEG VRDIYNSEFA KKKMLEQELS KRLALHGFHE IQTPMFEFFD IFSKERGSVS 
GKEMYKFFDR EGNTLVLRPD ITPSIARCVA KYYKTEEMPI RLSYCGSTFI NSSSYQGKLK 
ETTQLGAELI NDASIEADAE MIALTVECLK CAGLKEFQVE IGQADFFLGI VEEAGFDEDE 
TEQLRILIEN KNLFGVEELI SGKKLEKPVK SVILQLTDLF GTLDKVLGVK ESIHNERARN 
ALERMEKLYE LLTLYGYEQY ITFDLGMLSK YNYYTGIIFR AYTYGTGDAV ITGGRYDSLV 
SQFGKQAPAI GMAVLIDQLL TALSRQKLLG EPELENTLIV YDSSYIANAV ALANHFRGQE 
MKIEMLAHDE RKTREDYIAY ANRMSIGGIL ALFTEDEVEV IHAIDGTVQT VPLKGMLS