Gene Francci3_3548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3548
Symbol	hisS
ID	3904487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4242295
End bp	4243617
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	70%
IMG OID	637880869
Product	histidyl-tRNA synthetase
Protein accession	YP_482629
Protein GI	86742229
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.458882
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.233684
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGACG CGCCGATCGT CCGTCCCCTG CCCGTGAGCG GATTTCCCGA GTGGCTGCCC 
GAGGTCCGTC TCGTCGAGCA GCGCTGGCTC GACACCATCC GAGCGACGTT CGAGCGGTAC 
GGCTTCTGCT CGGTGGAGAC CCCCTCGGTC GAGGCGCTCG AGGTGCTGAC CGCGAAGGGG 
GAGACCTCCC AGGAGGTCTA CATGCTACGC CGCCTGCAGG CCGACGCCGA CGACGACAGC 
GCCCGCCTCG GCCTGCACTT CGACCTCACA GTGCCTTTCG CGCGGTACGT GGCCGCCCAC 
TTCAACGACC TCGTGTTCCC GTTCAAGCGC TACCAGATCC AGCGGGTGTG GCGGGGGGAG 
CGTCCTCAGG AGGGCCGCTT CCGCGAGTTC ACCCAGTGCG ACATCGACGT GATCAACGTT 
GATCAGGTGC CCCTGCACTT CGACGCGGAA CTTCCCCGCA TCGTGCACGA GGTCCTGGGC 
ACCCTCGGCG TTCCGCCCTG GACCCTCAAC ATCAACAATC GCAAGGTGCT CCAGGGCTTC 
TACGAGGGTC TGGGCATCGG CGATCCGCTG GCCGTCATCC GGGTCGCCGA CAAGCTCGAC 
AAGATCGGCC TCGCGGGGGT GGAGGGGCTG CTGACCACCG CGGTCGGGCT CGACCCGGAC 
CAGGTGCGCG CCTGCCTGGA GCTCACGGGC ATTCGGGGCT GCGATCCCGG CGTCGTCGAG 
GAGGTACGCC GGCTCGGGGT GAAATCGGAC CTGCTCTCCG AGGGGCTCGA CGAGCTCGCC 
GCGGTTCTCG GCGATCTCGC CGACCTGCCC GCCGGCGACG TGGTCGCGGA CCTCTCGATC 
GCCCGCGGTC TCGACTACTA CACCGGGACC GTCTACGAGG CGAAGTTCGT CGACTGGCCG 
GACTTCGGCA GCATCTGCTC GGGGGGGCGG TACGACAACC TTGCCGGCTC CTTCATCCGC 
CGCAACCTCC CCGGCGTCGG GATCTCGATC GGCCTCACCC GCATCTTCGC CAAGCTCCTG 
GCCGAGGGCC TGCTCACCAC CGGGCCGTCC AGCCCCGCCG ACGTGCTGGT CGTGATCCCC 
GCCGCGCCGC GCCGCGCCGC CGCCCTCGCG ACGGCCGCCG AGCTGCGCAC CCGGGGGCTG 
CGGGTGGAGA CCTACCACCA GCCGGACAAG GTGGCCAGGC AGGTCCGCTA CGCCTCCCGC 
AAGGGCATCG GATTCGTCTG GTTCCCGCCC TTCGACGATG GCCGGGCGCA CGAGGTGAAG 
AACATGGCCA CCGGGGACCA GTCCGCGGCG GACCCGGCGA CCTGGACCCC GTCCGCGGGC 
TGA

Protein sequence

MSDAPIVRPL PVSGFPEWLP EVRLVEQRWL DTIRATFERY GFCSVETPSV EALEVLTAKG 
ETSQEVYMLR RLQADADDDS ARLGLHFDLT VPFARYVAAH FNDLVFPFKR YQIQRVWRGE 
RPQEGRFREF TQCDIDVINV DQVPLHFDAE LPRIVHEVLG TLGVPPWTLN INNRKVLQGF 
YEGLGIGDPL AVIRVADKLD KIGLAGVEGL LTTAVGLDPD QVRACLELTG IRGCDPGVVE 
EVRRLGVKSD LLSEGLDELA AVLGDLADLP AGDVVADLSI ARGLDYYTGT VYEAKFVDWP 
DFGSICSGGR YDNLAGSFIR RNLPGVGISI GLTRIFAKLL AEGLLTTGPS SPADVLVVIP 
AAPRRAAALA TAAELRTRGL RVETYHQPDK VARQVRYASR KGIGFVWFPP FDDGRAHEVK 
NMATGDQSAA DPATWTPSAG