Gene Francci3_4267 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4267
Symbol
ID	3907234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5090035
End bp	5091441
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	71%
IMG OID	637881593
Product	prolyl-tRNA synthetase
Protein accession	YP_483342
Protein GI	86742942
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.975115
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGTAC TCACCTCCCG CTCGACCGAC TTTCCGCGCT GGTATCAGGA CGTGCTCGCC 
AAGGCCGAGC TGGCCGACAA CGGCCCCGTC CGCGGGACGA TGGTCATCCG ACCGTACGGC 
TACGCGATCT GGGAACGCAT GCAGGCCGAG GTGGACTCCC GAATCAAGGC CGCCGGGGCC 
GTCAATGCCT ACTTCCCCCT GTTCATCCCC GAAAGCTACC TGCGCCGGGA GGCCGAGCAC 
GTCGAGGGCT TCAGCCCGGA GCTGGCGGTG GTCACCATCG GTGGCGGCAA GGAGCTGGAG 
GAGCCCGTAG TCGTCCGGCC CACCAGCGAG ACCGTGATCG GCGAATACCT GGCGAAGTGG 
ACCCAGAGCT ACCGTGACCT GCCCCTGCTG CTCAACCAGT GGGCGAACGT GGTCCGGTGG 
GAGCTGCGTC CCCGGCTGTT CCTGCGCAGC AGCGAGTTCC TCTGGCAGGA GGGCCACACC 
GCGCACGCCG ACGAGGCCGA TGCCGCGGCC TACGCCCGTC GGATCGCGCT CGAGGTCTAC 
CGCGACTTTA TGACGCAGGT GCTGGCGGTC CCGGTGTTCG TCGGAGTGAA GACGCGCCGG 
GAACGGTTCG CCGGCGCGAC CAACACCATG ACCTGCGAGG GCATGATGGG CGACGGCAAG 
GCTCTGCAGA TGGCGACCAG TCACGAGCTC GGCCAGAACT TCGCCCGTGC CTTCGACATC 
GACTTCCTCG GCGCCGACGG AGCCCGGCAT CTGGCGTGGA CGACGTCGTG GGGCTGCTCG 
ACCCGGATGG TCGGCGGGCT GATCATGGCA CATGGCGACG ACAACGGCCT GCGTGTCCCG 
CCCCGGTTGG CGCCGACGCA GGTCGTGGTC CTGCCGGTGC GCGACGAGGA GACCGTCGTC 
GCGAAGGCCC GCCAGATCGC CGCCGCCCTG ACCGACGCCG GTCTTCGGGT GCAGGTCGAC 
GCCCGTCCCG GGTTGTCCTT CGGCCGGCGG GTCACCGACG CGGAGATCAA GGGCATCCCG 
GTACGGGTTG AGGTGGGTCC GCGGGACCTG GCCGCGGGCA ACGTCACCCT GGTGCGCCGG 
GACACCTCCG AGAAGGTGCC GGTGCCGCTG GCCGAGGTCG CCACGCGGGT GCCGGTGCTG 
CTGGGCGAGG TGCAGGCCGA CCTGTACGCC GAGGCGCTGG CCCTACGCGA GAGCCGGACG 
ACGGACGTCG CCACCGTTGC CGAGGCCGCC CGGGCCGCCC AGGCCGGCTT CGCCCGGATC 
CCCTGGCGCC TTGTCGGCGA GGAGGGCGAG GCCGAGCTCG CCGAGGAGGC GCTCACCGTG 
CGGTGCATCC AGACACCGGA CGGCGGGATC CCCGAGGCCG GCAGCGACGC CGACGACCTC 
GTCTGCCTGA TCGCCCGCTC CTACTGA

Protein sequence

MAVLTSRSTD FPRWYQDVLA KAELADNGPV RGTMVIRPYG YAIWERMQAE VDSRIKAAGA 
VNAYFPLFIP ESYLRREAEH VEGFSPELAV VTIGGGKELE EPVVVRPTSE TVIGEYLAKW 
TQSYRDLPLL LNQWANVVRW ELRPRLFLRS SEFLWQEGHT AHADEADAAA YARRIALEVY 
RDFMTQVLAV PVFVGVKTRR ERFAGATNTM TCEGMMGDGK ALQMATSHEL GQNFARAFDI 
DFLGADGARH LAWTTSWGCS TRMVGGLIMA HGDDNGLRVP PRLAPTQVVV LPVRDEETVV 
AKARQIAAAL TDAGLRVQVD ARPGLSFGRR VTDAEIKGIP VRVEVGPRDL AAGNVTLVRR 
DTSEKVPVPL AEVATRVPVL LGEVQADLYA EALALRESRT TDVATVAEAA RAAQAGFARI 
PWRLVGEEGE AELAEEALTV RCIQTPDGGI PEAGSDADDL VCLIARSY