Gene Franean1_0768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0768
Symbol
ID	5669184
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	893601
End bp	894662
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	70%
IMG OID	641239695
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001505132
Protein GI	158312624
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0510321
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0451069
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGGGAGA GCGCGATCTG GTGGGCCGTA GAATCACCCG ACATGACGCA GGACCGGCCA 
CGGGTCTCGC TGACCGGCAT CAAGCCGACC GGCGATCCGC ACCTGGGCAA CTACATCGGG 
GCGATCCGCC CCGCCCTCGA CCTGGCGGCG ACGTACGAGT CGATCTACTT CATCGCCGAC 
TACCACGCCC TGACCTCCAT CCGGGACAGG GCGAAGTTCG CCGCCTACAC CCGGTCCGTC 
GCCGCCACCT GGATCACGCT CGGGCTCGAT CCCGAGCGCA CGGTCTTCTA CCGGCAGTCC 
GACGTCCCGG AGATCTTCGA GCTGACCTGG ATCCTGTCCT GTGTCACGGG CAAGGGCCTG 
ATGAACCGGG CGCACGCCTA CAAGGCGGCG CGGGACCGCA ACGCCGAGAG CGGCGTCGCC 
GACCTCGACG CGGGCGTCAA CATGGGGCTG TTCAACTACC CCATCCTGAT GGCCGTCGAC 
ATCCTCGTCA TGGGCGCGGA CGTCGTCCCC GTCGGCCAGG ACCAGTCGCA GCACCTCGAG 
ATCGCCGCGG ACATCGCCGG CTCGTTCAAC CACCTCTACG GCGACGTGTT CAGCCTGAAG 
ATTCCCGAGG CGGTGCTGCC GTCCGGGGCC AACGCGCGGA CGATGCCCGG CACCGACGGC 
CGGAAGATGA GCAAGTCGTA CGGGAACACG ATTCCGCTGT TCGCGCCGCC GTCCCAGCTG 
CGCAAGCTGG TGCGCGGCAT CCGCAGCGAC AGCACGCCGG TCGAGGCGCC GAAGGATCCG 
GACGCCTCCG CCGCCTTCCA GATCTACGAG AACTTCGCGG ACCCGGAGGC CGTCAAGGAC 
ATGCGGGTCC GCCTCGAGCA GGGCGGCACC GGCTGGGGCG AGCTGAAGAA CGCCCTGTTC 
GAGACGCTCG ACGCCTGGCT GACCCCACTG CGGGCCCGCT ACGACGAGCT GGTGGCCCCG 
GGCAGCGAGC TGGACGCGAT CCTCGCCGCC GGCGCGGACA AGGCCCGCGA CCGCGCCCGC 
CCCGTCCTGG CCGGCGCCCG CCGCGCGATC GGCGTCGGCT GA

Protein sequence

MGESAIWWAV ESPDMTQDRP RVSLTGIKPT GDPHLGNYIG AIRPALDLAA TYESIYFIAD 
YHALTSIRDR AKFAAYTRSV AATWITLGLD PERTVFYRQS DVPEIFELTW ILSCVTGKGL 
MNRAHAYKAA RDRNAESGVA DLDAGVNMGL FNYPILMAVD ILVMGADVVP VGQDQSQHLE 
IAADIAGSFN HLYGDVFSLK IPEAVLPSGA NARTMPGTDG RKMSKSYGNT IPLFAPPSQL 
RKLVRGIRSD STPVEAPKDP DASAAFQIYE NFADPEAVKD MRVRLEQGGT GWGELKNALF 
ETLDAWLTPL RARYDELVAP GSELDAILAA GADKARDRAR PVLAGARRAI GVG