Gene Franean1_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2072
Symbol
ID	5670473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2495711
End bp	2496733
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	75%
IMG OID	641240994
Product	putative OxPP cycle protein OpcA
Protein accession	YP_001506415
Protein GI	158313907
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3429] Glucose-6-P dehydrogenase subunit
TIGRFAM ID	[TIGR00534] opcA protein

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.833679
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0837693
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC TGTGGGACAC CACCGGATCG GCGGTGGTCA AGGCGCTGTC CGCCGAGCGG 
CGGGCCGCCG GCGCGCTCGC GTTCGGCCTG GCGCTGACGC TCGTGGTGGT CGTGGACGAG 
CAGCACGTCA GCCAGGCGGA GAGCGCCGCC ACCGCGGCCG CCGCCGCCCA CCCGTGCCGG 
CTGCTGATCG TCGTGCGCCG GCAGATCGAC TCGCCGCACC CTCGGCTGGA CGCCGAGGTG 
TCGATCGGCG GCCGGCTGGG GCCCGGCGAG GCCGTCGTGA TGCGGATGTC GGGCCGGCTC 
GCGCTGCACG CCGAGTCGGT CGTGCTCCCG CTGCTCGCGC CGGACGCCCC CGTGGTCACC 
TGGTGGTACG ACGCTCCCCC GGAGAAGATC GCCTACGACC CGCTCGGCGT GTTCGCCGAC 
CGCCGGGTCA CCGGGACCTA CGCGGCCCAC GACCCGCTGG CCGCGCTGCT GCAGCGGGCC 
GAGGACTTCG TCCCCGGTGA CACCGACCTG GCCTGGACCC GCATCTCGGG GTGGCGCACC 
CTGCTGGCGG CCGCGTTCGA CCAGGTCTCC GAGCCGGTGG GGCCGGCGAC GGTCGTCAGC 
GAGCCGGGCA ACCCCAGCGC CCGCCTGTTC GCCGGCTGGC TGCAGGCGAA GCTGCGGGTC 
CCGGTAACGA TCACCGACGC GCCGGGTAAG AAGGGCATCC AGAGCGTCCG CCTGGCGGTG 
GGCGACGGCG AGCTCTCACT GGCCCGCACG GACAGCCGTT CGGCCGGTAT CACCCGCACG 
GGTTACCCGA CCAGGGTGCT GCCGCTGCCC GAACGAGGGC TGGGTGACCT GCTCGCGGAG 
GAGCTGCGCC GCCTCGACGA CGACAGCGTG TACGCCGAGG CGCTCTCGGC CTGGAGCGGC 
GTCCCGGATC TGAACAGCCG ACCGCTGCAC CGCGAGCACA TCTGGCGCGA TCCGGCGCTG 
GAGCGCTCCG AGGCGGCATT CGCGGCGATC CCACCCGCGC CGATCCCGCC CGCGGCGTCG 
TGA

Protein sequence

MTTLWDTTGS AVVKALSAER RAAGALAFGL ALTLVVVVDE QHVSQAESAA TAAAAAHPCR 
LLIVVRRQID SPHPRLDAEV SIGGRLGPGE AVVMRMSGRL ALHAESVVLP LLAPDAPVVT 
WWYDAPPEKI AYDPLGVFAD RRVTGTYAAH DPLAALLQRA EDFVPGDTDL AWTRISGWRT 
LLAAAFDQVS EPVGPATVVS EPGNPSARLF AGWLQAKLRV PVTITDAPGK KGIQSVRLAV 
GDGELSLART DSRSAGITRT GYPTRVLPLP ERGLGDLLAE ELRRLDDDSV YAEALSAWSG 
VPDLNSRPLH REHIWRDPAL ERSEAAFAAI PPAPIPPAAS