Gene Franean1_0348 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0348
Symbol
ID	5668772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	416807
End bp	418222
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	72%
IMG OID	641239280
Product	prolyl-tRNA synthetase
Protein accession	YP_001504720
Protein GI	158312212
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0147635
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGACG TGGCTGTTCT CACCCCCCGC TCCACCGACT TCCCGCGTTG GTACCAGGAC 
GTGCTCGACA AGGCCGAGCT CGCCGACAAC GGGCCCGTGC GCGGCACAAT GGTCATCCGG 
CCGTACGGCT ACGCGCTGTG GGAACGGATG CAGGCCGACG TCGACACCCG GATCAAGGCC 
GCGGGCGCGG TGAACGCCTA CTTCCCATTG TTCATCCCGG AGAGCTACCT GCGCCGGGAG 
GCCGAGCATG TCGAGGGGTT CAGCCCCGAG CTGGCCGTCG TCACCCACGG TGGCGGCAAG 
GAGCTGGCCG AACCGGTCGT CGTCCGTCCC ACCAGCGAGA CGGTGATCGG CGAGTACATG 
GCCAAGTGGA CGCAGAGCTA CCGGGATCTG CCGCTGCTGC TGAACCAGTG GGCGAACGTC 
GTCCGCTGGG AGCTGCGCCC GCGGCTGTTC CTGCGCACCA GCGAGTTCCT GTGGCAGGAG 
GGGCACACCG CCCATGCGGA CGCCGCGGAC GCCGCCGCCT ATGCCCGCCG GATCGCGCTC 
GAGGTGTACC GGGAGTTCAT GACCTCGGTG CTCGCGCTGC CGGTGTTCGT CGGGGCGAAG 
ACCCGCAAGG AGCGCTTCGC CGGCGCGATC AACACGATGA CCTGCGAAGG CATGATGGGT 
GACGGCAAGG CGCTGCAGAT GGCGACGAGC CACGAGCTCG GCCAGAACTT CGCCCGCGCC 
TTCGACATCG ACTTCCTCGG GCCGGACGGC GGCCGCCACC TGGCGTGGAC GACCTCCTGG 
GGCAGCTCCA CCCGCATGAT CGGTGGCCTG ATCATGGCTC ACGGCGACGA CAACGGCCTG 
CGGGTGCCGC CCGTGCTCGC GCCCACCCAG GTAGTGGTGC TCCCGGTCCG CGACGACGAC 
GCCGTGGTCA CGAAGGCCCG CGAGATCACC GACGCGCTCA CCGCACTCGG CGTCCGGGCC 
AGGCTGGACG CCCGCCCCGG TCTGTCGTTC GGCCGCCGGG TCACCGACGC CGAGCTCAAG 
GGCATCCCCG TCCGGGTCGA GGTCGGGCCG CGCGACCTGG CCGCCGGCAA CGTCACGCTG 
GCCCGCCGGG ACACCGCCGA GAAGTTCCCG GTGCCGCTCG GTGAAGCCGC CGGCCGTGTC 
CCCGTCCTGC TCGACGAGGT GCAAGCGAGC CTGTACGCAC AGGCCCTGGC GCTGCGCGAC 
GAGCGCACCT CGGACGTCAC CTCGCTGACC GAGGCGGTCG AGGCCGCCGC GACGGGCTTC 
GCCCGGCTGC CCTGGCGCCT GGTAGGTGAG GACGGCGAGG CACGGCTCGC CGAGGACTCG 
CTGACCGTCC GCTGCCTGCA GACGCCGGAC GGCGCCCTGC CGACCGCGGA CACCAGGGAC 
GAGGATCTCG TCTGCCTCGT GGCCCGCGCC TACTGA

Protein sequence

MDDVAVLTPR STDFPRWYQD VLDKAELADN GPVRGTMVIR PYGYALWERM QADVDTRIKA 
AGAVNAYFPL FIPESYLRRE AEHVEGFSPE LAVVTHGGGK ELAEPVVVRP TSETVIGEYM 
AKWTQSYRDL PLLLNQWANV VRWELRPRLF LRTSEFLWQE GHTAHADAAD AAAYARRIAL 
EVYREFMTSV LALPVFVGAK TRKERFAGAI NTMTCEGMMG DGKALQMATS HELGQNFARA 
FDIDFLGPDG GRHLAWTTSW GSSTRMIGGL IMAHGDDNGL RVPPVLAPTQ VVVLPVRDDD 
AVVTKAREIT DALTALGVRA RLDARPGLSF GRRVTDAELK GIPVRVEVGP RDLAAGNVTL 
ARRDTAEKFP VPLGEAAGRV PVLLDEVQAS LYAQALALRD ERTSDVTSLT EAVEAAATGF 
ARLPWRLVGE DGEARLAEDS LTVRCLQTPD GALPTADTRD EDLVCLVARA Y