Gene Franean1_5309 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5309
Symbol
ID	5673643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6391333
End bp	6393675
Gene Length	2343 bp
Protein Length	780 aa
Translation table	11
GC content	77%
IMG OID	641244166
Product	4-alpha-glucanotransferase
Protein accession	YP_001509573
Protein GI	158317065
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.242878
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACATCCG CGCCCGAGCG CCCCGACCAG CCCGCCGCGC CCCCCGCCGC TACCGCGCCG 
CCTACCACTG CGGCGCCGTC AGCCGCCGCG CCGTCAGCCG GCGGCGCGGT CGGAGCCGGT 
GGGCAGCAGG GCCCGGCGTC GGTCTGGTCC GGGCTCGGTG ACCTCAAGGC CCTCGCCGCC 
GAGTTCGGGG TGGCCACGTC CTACGACGGG CAGGACGGCA CGCCGGTCAC GGTGCAGCCG 
AGGGCCGTCC GGGCGGCGCT GGGCCTGCTC GGCGTCGACC CGTCGGACCC GGCCGTCGCG 
CTCGCCGGGG CACGCGAGGC GCGTCGGCGG CGCCCGCTGC CCCCGTGTGC GGTCGTCCGG 
GCGCAGGCCC CCGCGCCGGT CGCCGTGCAC GTGCCGGATG CCGCCGCGGA CGCCGTCACC 
GCCGAGGCCG TGCTGGCCGG CGGGGAGAGC GTGCCGCTGT CGGTCGGGCT GCGCGGCGCT 
GTCGGGGAGG TCGACGGCCA TGCCGTCCGC GCGGGCACGG TGGACCTGCC GTCCGGCCTG 
CCGCTCGGGG ATCACCGCCT GCGGCTGAGC TTCGGCGGGA GCACCACCGA GTGCCCGCTG 
ATCGTCGTCC CGGAGCGCGT GCCCGACTTC GCGGCCGCCC CGAGCCCGGC CGAGGCCACC 
GGGCGGGCCT GGGGCTGGAT GATCCAGCTG TACGCGCTCA CCTCCGCGGG ATCGTGGGGG 
ATGGGCGACT ACGCCGACCT CGCCACCCTC GCCGAGTGGT CCGCGCGTGA CGGCGCCGAC 
GTTCTGCTGG TGAACCCGCT GCACGCGGTG GCGCCGACCT TTCCGGTCGA GCCGTCGCCG 
TACTCGCCGG CGAGCCGCCG CTTCGTCTCA CCGCTCTACC TGCGGCCCGA GCTGACCCCG 
GAGTACCGGC ACGCCTCCGA GACGGTGCGG GCGGAGGTCG ACCGGCTGGC GGGAGTCGCC 
CGCCGGGAGG GGATCAGGGA CGGCCTGATC GACCGGGACG CGGTGTGGCG GGCCAAGCTC 
GCCGCCGTCG AGCTGCTGTT CACCTCGTCC GGCGGCGGGA CGGGCGACGG GCCGGCCGGT 
GGGCAGGAGG CCGATGGCGC GCTGCGCGAC TTCGCGCTCT GGTGCGCGCT CGCCGAGCGG 
CACGGCCGGG ACTGGCGCAC CTGGCCGGAG GACCTGCGCG ATCCCGCCGG GCCGGCGGTC 
GACGCCGCGC GCGCCGAGCT GGCGGAGCGC GTCGCGTTCC ATGTCTGGCT GCAGCGGCGG 
TGCGACGACC AGCTCGGCGC GGCGCAGGCC GCCGCCAGGA CGGCGGGGAT GCGGGTCGGC 
ATCGTCCACG ATCTCGCTGT CGGGGTCGAT CCGGGCGGCG CGGACGCCTG GGCGATGCGC 
GGCGTGCTGG CCACCGGGGC CTCCGTCGGC GCCCCGCCGG ACGGCTTCAA CCAGCAGGGC 
CAGGACTGGG GCCTCCCGCC GTGGCGGCCC GACGTCCTCG CGGAGAGCGG GTATGCCCCG 
TTCCGGGCGA TGGTCGCCGC GGTGCTGTCC CGGGGCGGCG GGCTACGGGT GGATCACATT 
CTCGGGCTGT TCCGCCTGTG GTGGGTCCCG GACGGCGCCG GCGCCGCCGG CGGCACTTTC 
GTCCGCTACG ACGCCGAGGC GCTGCTGGGG CTGCTCGCCC TCGAGGCGCA CCGGGCCGGC 
GCCCTGGTCG TCGGTGAGGA TCTCGGCACC GTCGAGCCGT CGGTGGCCGA GGCGCTCGAC 
GGCGCCGGGA TCTTCGGCTC CTCGGTGCTG TGGTTCGAGC AGGCGGCGGA CGGCTCCCCG 
CTCCCGCCGC GCGAGTACCG GGCCCGGACC ATGGCCAGCG TGACCACGCA CGACCTGCCC 
ACCGCCGCCG GCTTCCTCGA GGGCGAGCAC GTGCGCGTGC GCGCGCGGCT CGGCCTGCTC 
GCCCGCACCG ACGAGCAGGA ACGCGCCGCC TGGCTCGCCG AACGCGCCGG ACTGCTGCGG 
CTGCTCGCCG ACGAGGGCCT GGTGAGCCCG CCGGCGGGGG TCGTGGCGGA GGAGGATCGC 
CTCGAACCGG AGCTGCGTGC GGCGGCCGCG CTCGGCCTGC ACGTCCTGCT TGCCCGGTCA 
CGCGCGCGGA TCGTGCTGGT CGCTCCCGGT GACGCGTTCG GCGACGTCCG TCAGCCGAAC 
CTGCCCGGCA CGGTCGACAG CTATCCGAAC TGGCGGCTAC CGGTCGTCGA CGACGCCGGG 
GAGCGCGTCA CCGTCGAACG GCTGATCACC GATCCCCGGT CGCGCCGGAT GGTCGAGGCA 
CTCGAGGCAC TCGGGGCGAT CACCGCCGAT CGGGCGGGAG CCACCACCAC CCGGCGCCCC 
TGA

Protein sequence

MTSAPERPDQ PAAPPAATAP PTTAAPSAAA PSAGGAVGAG GQQGPASVWS GLGDLKALAA 
EFGVATSYDG QDGTPVTVQP RAVRAALGLL GVDPSDPAVA LAGAREARRR RPLPPCAVVR 
AQAPAPVAVH VPDAAADAVT AEAVLAGGES VPLSVGLRGA VGEVDGHAVR AGTVDLPSGL 
PLGDHRLRLS FGGSTTECPL IVVPERVPDF AAAPSPAEAT GRAWGWMIQL YALTSAGSWG 
MGDYADLATL AEWSARDGAD VLLVNPLHAV APTFPVEPSP YSPASRRFVS PLYLRPELTP 
EYRHASETVR AEVDRLAGVA RREGIRDGLI DRDAVWRAKL AAVELLFTSS GGGTGDGPAG 
GQEADGALRD FALWCALAER HGRDWRTWPE DLRDPAGPAV DAARAELAER VAFHVWLQRR 
CDDQLGAAQA AARTAGMRVG IVHDLAVGVD PGGADAWAMR GVLATGASVG APPDGFNQQG 
QDWGLPPWRP DVLAESGYAP FRAMVAAVLS RGGGLRVDHI LGLFRLWWVP DGAGAAGGTF 
VRYDAEALLG LLALEAHRAG ALVVGEDLGT VEPSVAEALD GAGIFGSSVL WFEQAADGSP 
LPPREYRART MASVTTHDLP TAAGFLEGEH VRVRARLGLL ARTDEQERAA WLAERAGLLR 
LLADEGLVSP PAGVVAEEDR LEPELRAAAA LGLHVLLARS RARIVLVAPG DAFGDVRQPN 
LPGTVDSYPN WRLPVVDDAG ERVTVERLIT DPRSRRMVEA LEALGAITAD RAGATTTRRP