Gene Franean1_5567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5567
Symbol
ID	5673896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6747275
End bp	6748438
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	76%
IMG OID	641244422
Product	hypothetical protein
Protein accession	YP_001509826
Protein GI	158317318
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.661467
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGTCC TCTTTGCGTC GTTGCCGGCA TACGGGCACC TCTACCCGCT GATCCCCCTC 
GCGGTGGCCT GCCAGGACGC GGGGCACCGG GTCCGCCTGG CCACCGGCGA GCCCTTCCTC 
GGGGCCCTCC CTGTGCCGAC CGTCCAGGGC ACGCCGGCCG GGTGGACGCT GCAGTACGTG 
GAGGGCGAGA CAGCCCGTCG CCACCCGGAC GCGACCGGCG TCGAGTTCCC CGTCGCCATG 
TTCGCCGATG TGGCGGCCGA AGGGGTGATG GACGCGCTTG AACCGCTGTT CGCCGCGGAT 
CCGCCGGAAG TGGTGGTCGC CGACAGCGCC AACCTCGGGG CCGTGATCGC CGCGCACCTC 
GCCGGTGTCC CAGCCGTGAT CTTCGGGGTC GGCCAGTGGA GCCCCTTCGG TGAGATGACC 
TTCCCCGCCG CCCTGGCGGC GCACCGCTCC CGCTGGACCG CGGCGGGGCT CGTCGCCCCC 
GGGGAGCCGG GTGAGGTGAT CGCCGCCTAC CTCGAGCCCT TCCCACCGGG CCTGCGGCAG 
GAGCCCGGCC CCGGCGGCGT GCCGGTGCTG CCGATCCGCA GCACGGCCTG GGCCGGCGCG 
CAGGCGCCCG TGCCCGGCTG GCTGACCGCT CCCGCCGAGC GGCCCCGGGT GTACGTCACG 
CTCGGCACCG TCTCGTTCGG CGCCGTCGAG GTGATCCGGG CGGTCGTCGA CGACCTCGCC 
GCGCTGGACG TCGACGTGCT CGTCGCGGCC GGCCCGGAGG GCGACCCGGC GGCCCTGGGC 
GCGCTGCCCG AGCGGGTGCG GGTCGAGCGG TTCGTGGCCC AGAGCCGCGT GCTCGGTCTG 
GTGGACGTCG CCGTCCACCA CGGAGGCTCG GGCACGGTGC TCGGCGCGCT GGCGAACGGC 
GTCCCCCAGG TGCTGCTGCC GCAGGGTGCG GACCACTTCC ACAACGCGCA GCTGCTCGCC 
GAGCGCGGCG CCGCCCGGGT GTTCCACAAC GAGGCACGGC AGCCGGGTGA CGTCGCCGCG 
GCCGTCCGCG ACCTGCTCGG TGACGCCCCC GAGCGCCGTG CCACCGCCAC GCTCGCCGCG 
CAGATCGCCG CGAGCCCGAC TCCCGCCGAC GTTGTGGCGG CAATCGCCGC GATCGCCGAG 
GCCGCCGCGA AAACCCGGCG ATGA

Protein sequence

MDVLFASLPA YGHLYPLIPL AVACQDAGHR VRLATGEPFL GALPVPTVQG TPAGWTLQYV 
EGETARRHPD ATGVEFPVAM FADVAAEGVM DALEPLFAAD PPEVVVADSA NLGAVIAAHL 
AGVPAVIFGV GQWSPFGEMT FPAALAAHRS RWTAAGLVAP GEPGEVIAAY LEPFPPGLRQ 
EPGPGGVPVL PIRSTAWAGA QAPVPGWLTA PAERPRVYVT LGTVSFGAVE VIRAVVDDLA 
ALDVDVLVAA GPEGDPAALG ALPERVRVER FVAQSRVLGL VDVAVHHGGS GTVLGALANG 
VPQVLLPQGA DHFHNAQLLA ERGAARVFHN EARQPGDVAA AVRDLLGDAP ERRATATLAA 
QIAASPTPAD VVAAIAAIAE AAAKTRR