Gene Francci3_2642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2642
Symbol
ID	3906315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3117228
End bp	3118622
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	70%
IMG OID	637879967
Product	cysteinyl-tRNA synthetase
Protein accession	YP_481733
Protein GI	86741333
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID	[TIGR00435] cysteinyl-tRNA synthetase [TIGR03447] cysteine--1-D-myo-inosityl 2-amino-2-deoxy-alpha-D-glucopyranoside ligase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.736924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.302095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCGG CTACGCTGCG GTTACTCTCC TTGTGCCCGC CGGAGAGTCG GTTCGCGGTT 
ACTCTGACAC GCATGCAGGC GTGGCCATCT CCTCCGATAC GTTCTCTTCC CGGTCACGGG 
AAGCCACTGA GGATCTTCGA CACGGCCACG TCGAGCGTAC GCGAGTTGGC GCCGGCCGTC 
ACCGCAAGGC TGTATGTGTG TGGCATCACG CCCTATGATG CGACGCATCT GGGGCATGCC 
TTCACCTACC TCACCTACGA CCTCGCGCAG CGTGTGCTGC GAGACGCCGG GCATCACGTC 
CACTATGTAC AGAACGTAAC GGATGTCGAT GACCCGTTGC TTGAGCGAGC CACCCGTGAC 
GGGCTGGACT GGCGGGCCCT CGCCGACCGG GAGATCGACC TGTTCCGCGA GGACATGACC 
GCGCTGCGGA TGTTGGCGCC GGACGCCTAC GTCGGGGTGG TCGAGGCCAT CCCGATGATC 
GTCGACATGG TGGTGGAGCT CGTCGACCGG GGCGCGGCCT ACCAGGTCGA CGACGACCTG 
TACTTCTCGA TCGCCACCGC ACCCGCCTTC GGGGAGATCT CGCATCTCAG CCGGGCCGAG 
ATGCTGGCGA TCTGCGCCGA GCGCGGGGGT GACCCGCGCC GGACCGGCAA GAAGGACCCC 
CTCGATCCGC TGCTGTGGCG CGCCCACCGC CCCGGCGAGC CGTCCTGGCC CTCGCCGTTC 
GGCCCCGGCC GGCCCGGCTG GCACATCGAG TGCTCCGCCA TCGCCCGCCA CTATCTCGGC 
GGGGTCATCG ACATCCAGGG TGGCGGAACC GACCTGAGCT TTCCGCACCA CGAGTGCAGC 
GCGGCGCACG CCGAGGTCGC CGCCGGCATC CGGCCGTTCG CCCGCAGCTA CGTGCACACC 
GCGATGGTGA GCCTCGACGG CCACAAGATG TCGAAGTCGC GGGGCAACCT GGAGTTCGTC 
TCCCGGCTGC GCCGGGCCGG GGTGGATCCG GCGGCCCTGC GGCTGGCCCT GCTCGATCAT 
CGGCACACCG AGGACTGGGA GTGGACGCCG GGCCTGCTCG ACGACGCCGT GGACCGGATG 
AACCGGTGGC GGGCCGCCGT CGCCCTGCCC ACCGGGCCTG ACGCCATGGG ACTGCTCGCC 
GCCGTGCGTG AGCGGCTCGC CGACGACCTC GACGCCCCGG GTGCCGTCGC CGCGGTGGAC 
GCCTGGGTCG GCGCCGCGCT CGCTGATGCG GGCGGCTCCG CCGGTGCGGG CCCGGATCCC 
ACCCATCAGG GGGGTCCGGT TCGCGGTTCT GGCGGTGACG TGCCCGCCTG GGGGGAGGCG 
CCCGCACTCG TGCGGCGCCT CGTTGACACA CTGCTGGGCG TAGACCTTGA ACCCGTCAGA 
CCCAGAGGGA GCTGA

Protein sequence

MLSATLRLLS LCPPESRFAV TLTRMQAWPS PPIRSLPGHG KPLRIFDTAT SSVRELAPAV 
TARLYVCGIT PYDATHLGHA FTYLTYDLAQ RVLRDAGHHV HYVQNVTDVD DPLLERATRD 
GLDWRALADR EIDLFREDMT ALRMLAPDAY VGVVEAIPMI VDMVVELVDR GAAYQVDDDL 
YFSIATAPAF GEISHLSRAE MLAICAERGG DPRRTGKKDP LDPLLWRAHR PGEPSWPSPF 
GPGRPGWHIE CSAIARHYLG GVIDIQGGGT DLSFPHHECS AAHAEVAAGI RPFARSYVHT 
AMVSLDGHKM SKSRGNLEFV SRLRRAGVDP AALRLALLDH RHTEDWEWTP GLLDDAVDRM 
NRWRAAVALP TGPDAMGLLA AVRERLADDL DAPGAVAAVD AWVGAALADA GGSAGAGPDP 
THQGGPVRGS GGDVPAWGEA PALVRRLVDT LLGVDLEPVR PRGS