Gene Francci3_1867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1867
Symbol
ID	3906142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2201881
End bp	2202993
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	65%
IMG OID	637879205
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_480972
Protein GI	86740572
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.705084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.228313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACACTG ATTCCGCGTC CATAGGCCTA GATACCACAG ACTCGGACCC CGCTACCTCG 
GCGCTCAGAA CCTCCGCCGC CCAGGCGCGC AGCGCGGAAT TGGAAGAACT GATTCTCAGC 
AACCCCGAGC GGTTTCGGGT ACTGACGGGT GACCGTCCTA CCGGGCGCCT ACATCTCGGG 
CACTACTTCG GCACGTTGCA CAATCGGGTT CGCCTTCAGG ATCTCGGGAC GGAGATCTTC 
CTGATTATTG CTGACTACCA GGTTCTGACC GATCGCGACG TAGCGGACAA CCTGACCGCC 
CACGTGGAGG AACTGGTCCT GGACTACCTG GCCATCGGCA TAGACCCGGC ACGCAGCACG 
ATCTTCACAC ACAGTGCCGT CCCCGCCCTC AACCAGCTGA TGCTGCCCTT TCTAAGCCTT 
GTCTCCGTTG CCGAGCTGAA CCGCAATCCC ACCGTCAAGG AGGAGATCGC GCATTCCCGG 
CAGTCGGCCG TCAGTGGCCT GATGTACACC TACCCCGTCC ACCAGGCCGC CGACATTCTC 
TTCTGCAAGG GAAACCTGGT CCCAGTGGGC CAGGACCAGC TTCCCCACCT CGAACTCGCC 
CGCACGATCG CCCGCCGCTT CAACGACCGC TACGGCGACG GCACCAGACT GTTTCCAGAG 
CCCGAGGCGC TCCTGTCGAG CGCGCCCCTT CTCCTCGGCA CGGATGGCTC CAAGATGAGC 
AAGAGCCGGC GTAACGCTGT GGCCCTGGCT GCGACCGCCG ACGAGACCGC CCGGCTGCTC 
AAGGGAGCGA AGACCGACTC CGAGCGCCAC ATCACCTACG ATCCCGCGAA CCGTCCCGAG 
GTGTCCTCCC TCCTCCTGCT CGCTTCGCTC TGCCAGAACC GGCACCCTCA TCAGGTCGCC 
GACGACATCG GCTCCGCCGG GGCCGCCGCA CTTAAGAAGA TCGTGATCGA AGCGGTCAAC 
GACTACCTGG CACCGATCCG GGCTCGCCGA GCCGACTACG CCGAGGACCG CTCCCATCTG 
CGCCGTGTGC TCCGCGAGGG CAACGAACGA GCGGGAGCCG TCGCCGACGC AACCCTCGCC 
GAGGTGCGTA CCGCCATGAA CAGCCACTAC TGA

Protein sequence

MNTDSASIGL DTTDSDPATS ALRTSAAQAR SAELEELILS NPERFRVLTG DRPTGRLHLG 
HYFGTLHNRV RLQDLGTEIF LIIADYQVLT DRDVADNLTA HVEELVLDYL AIGIDPARST 
IFTHSAVPAL NQLMLPFLSL VSVAELNRNP TVKEEIAHSR QSAVSGLMYT YPVHQAADIL 
FCKGNLVPVG QDQLPHLELA RTIARRFNDR YGDGTRLFPE PEALLSSAPL LLGTDGSKMS 
KSRRNAVALA ATADETARLL KGAKTDSERH ITYDPANRPE VSSLLLLASL CQNRHPHQVA 
DDIGSAGAAA LKKIVIEAVN DYLAPIRARR ADYAEDRSHL RRVLREGNER AGAVADATLA 
EVRTAMNSHY