Gene Franean1_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0653
Symbol
ID	5669070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	762954
End bp	764069
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	75%
IMG OID	641239580
Product	cysteine--tRNA ligase
Protein accession	YP_001505018
Protein GI	158312510
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.582134
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCCCG TGCTGCGGCT CGGCGGGGCG CCGCTGCCAG TGGTGGGCCG AGCCCGGGTC 
TACGTGTGCG GCATCACCCC GTACGCCGTC ACCCACCTCG GCCACGCGGC CACCTATCTG 
TGGACGGACC TGGCGATCCG GGTGTGGCGC AACGTCGGGG TCCCGGTCGA GCTGGCCCGC 
AACATCACTG ACGTCGACGA CGCGATGTTC GACGAGGCCC GCCGGACCGG CCTGCCCTTC 
GACCAGATCG CGTCGCTGCA GCGGTTCGCC TTCGACCGCA CGATGACCTC ACTCGGCATC 
CGCCCACCCG ACCACGAGCC GACCGCGCGC GCGGCCGTGA CCCGGGTGAT CGAGCTGGCG 
ACGGCGCTGC TGCGCGCCGG CCACGCCTAC GAGCGCGGCG GCAGCGTCTA CGCCCGGACA 
GCCGAGGCCG CCGAACGCGC CGGCCTCGAC CGGGCAGCCG CGATCGCCCT CGCCGCCGAG 
TACAACGACG ACCCGCACGA CCCCGAACGG GACGACCCAC TCGACGTCGC CGTCTGGCGC 
GCCGCCCGGC CGGACGGCGG GTACCCGAGC TGGCCCAGCC CGTGGGGCCC CGGCCGGCCC 
GGCTGGCACG CCGAGTGCGC GGCGATGGTC CTGTCGACCT TCGGCTCCAG CGTGGACCTG 
CACGCCGGCG GCGCCGACCT GCGCTACCCC CACCACGCCG TGGAGGCGCT GCTCGCCGAG 
CGCGCCACCG GCGTGCAACC GTTCGCGCGG GCCTGGCTGC GGCCGGGGAC CGTCCGTTCG 
GGCGGGGTCA AGATGTCCAA GTCGCTGGGC AACCTGACCT TCGTCGACGA CCTGCTGACC 
AGGCACAGCC CGGCCGCGGT GCGGCTGCTC TGCCTGGTGC GCCCCCGGGA CGACGACTGG 
GACTTCGACG AGGCTGCGTT CGACGAGGCC GAGGCCGGCC TGGACCTCCT CTACTCCGCC 
GCCGGCCGCC CCGGCGCCGT CCGGGGCGCC TCCGCCGTGG ACGAGGTCGA CGCCGCGCTG 
CTCGACGATC TCGACACCGT CCGGGCCCGG TCCATCGCTC TGGACTCCGG CGGTACCGCG 
GCCCGGCGGT TCATCTCCGT CCTCGGGCTC ACCTGA

Protein sequence

MRPVLRLGGA PLPVVGRARV YVCGITPYAV THLGHAATYL WTDLAIRVWR NVGVPVELAR 
NITDVDDAMF DEARRTGLPF DQIASLQRFA FDRTMTSLGI RPPDHEPTAR AAVTRVIELA 
TALLRAGHAY ERGGSVYART AEAAERAGLD RAAAIALAAE YNDDPHDPER DDPLDVAVWR 
AARPDGGYPS WPSPWGPGRP GWHAECAAMV LSTFGSSVDL HAGGADLRYP HHAVEALLAE 
RATGVQPFAR AWLRPGTVRS GGVKMSKSLG NLTFVDDLLT RHSPAAVRLL CLVRPRDDDW 
DFDEAAFDEA EAGLDLLYSA AGRPGAVRGA SAVDEVDAAL LDDLDTVRAR SIALDSGGTA 
ARRFISVLGL T