Gene Franean1_4956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4956
Symbol
ID	5673295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5949811
End bp	5951919
Gene Length	2109 bp
Protein Length	702 aa
Translation table	11
GC content	75%
IMG OID	641243810
Product	putative integral membrane protein
Protein accession	YP_001509226
Protein GI	158316718
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTGTCGG CGGTTTTCGT CCCGGCGGGC GTCGCGCTGC TGACTGTGCA CGAGACAGCC 
CAGCAGGCCC GTTTCTACCG CGGCGCGCTG GACGAGGCGC GGGTGCACGA GCGGATCAGC 
GACGAGGTCC TGACCGACCC GGTGCTCACG GACGTGACCG GTGACCTGCT CGCCGACCTG 
CCCGTCGACC CGGACCTGAT GGTCGACAAC CTGCAGCTCG TCGTCCCGCC GTCGGCGCTG 
CGCGGGATGA CCGACGGCGT CGCCGACAAC GTCGCCGCCT ACCTCGACGG CAGTCGCGCC 
GAGTTCGTCC TCGCCGTCGA TCTGCGGCCG ATCCTCGACA ACATCGGGCG GCTCGCGTCC 
GTTTACCTCG CCGGGCAGGT GTCGGGCGCG CCGCGGTACC GCACCGAGGA CGTCGCCGCC 
GCCCTGCGCG ACGTCCTCGA CGGTGTGGAC CGGGTCAGCC AGGGCCGCCC GCCCGCCTCC 
GTGCCCGAGA TCGATCTCAC CGACGATCAG GTCGCCTGGG CGACCGACCT GCTGGTGAGC 
CGGGTGGACG GGGCCGACCG GCCGGTCGCG CGGGAACAGG TGCTGGTCGC GCTGCGCTCC 
GGTGATCTCG GCGCCGCGCT GGCGGTCGTC GGCCCGCTGA TCTTCGCCGG GGACGTGTCC 
GCCGTCGCCG ACCTGCGGTC GCGCCTGGCC GGTGGCACCG TCCTCGACCT CGGCCGCCCG 
CTCGCGGACG CGCCCGGCGG CCCGGCCGGC TTCGTGCTCC GCACGATCCA CACGATCGGC 
GGCACGGGCA TGCTCGCCCT CGCCGCGCTC TGCTTCGCCC TGCCCGCCGG CGCGCTCGGT 
CTCGCCGTCC GGCGGCGCGG ACCGTCGGTG CGGCTGGTGG GCGCCGCGCT CGTCGCGGGC 
GGGCTGTCCG CGCTGGCTGC GGGGGTCCTC GTGACCGGCC TGGTCGGCGA CCCGCTCGCG 
CCGCTGCGCG GGCCGGACTC GCCCCTTCCC CCGGCGGGGC GGGTCCTCGC CGGAGACGTC 
GGCCGCGTGC TGGTCGCCAA CGTGCGCGCG ACCTGGAGCG AGATCGCGGC GATACCGCTC 
CTGGCCGGGC TCCTCCTCGG CACCGTGACG GTTGTGGTGC GCCGGCTGTC GCGCGCCGAG 
TGGCGCGTGC GGCGCCTGGT GGCGGTGGGC ACGACCTGCT CGGTGTTCGT CGCCGTGTCC 
TGGGTGCTGA TCCCCGGCGA GGCGGGCACC GGCACCGCGT TCTGCAACGG CGGGGCGGAC 
CTGTGCAACC GGCGCTACTC CGACGTGGTC TACCCGACGA CCCACAACGG GATGGCGTCC 
GTGCAGGCCG GGTTCCTCGG CGCGGTGCAG GACCCCGACC TGGTGGGCCA GCTCGACAGC 
GGCATCCGCG CCCTGATGCT CGACGTCCAC CACTGGACGA CACCCGCGGA GGTCGAGTCG 
TTCCTGGCCG AGCTGCGCCC GCGGGCCCGC GAGGCGCTCG CCCCGTTCGC CACCGGTGCC 
CGTTCGAGCC GCCCCGGGCT CTGGCTCTGC CACGGCATCT GCCAGCTCGG CGCGACCCGC 
CTGGACGACG CGCTGGCCGG CGTCGCGGGC TGGCTGGCGC GCAACCCGGC CGAGGTCATC 
ACCATCATCG TCCAGGACGG CGTCGCACCC GAACCGATCA TGGCCGCGTT CCGGGCGGCG 
GCCCTCGGTC AGTACCTGGT CCGCCCGCCC GCGCCGGGCC GGCCGTGGCC GACCCTCGGC 
CAGCTGATCG ACCGTGGCCG GCGCCTGGTC GTCTTCGCCG AGAACGGGGA CGTGCCCGGC 
ACCTGGTACC GCAACTTCTA CCGCTCCAAC GCGGACACCC CGTTCGACGT CCGGATCCCC 
GGGGGCTTCA GCTGCCGGAT CGGCCGCGGG GCCAGCCGGC CCACCATGCT CCTCATCAAC 
CACTGGCTCA CCGACCACGC CGCCACCCGC GCCGACGCGG CGCTGGTGAA CACCAGCTCG 
TCGCTGACGG CGCACGCCGA GCAGTGCGCC GCCCGCGGGC TGCGCCCGAC CTTCCTCGCG 
GTCAACTTCG CGACGGTCGG TGATCTTGTC TCCACCGTCG CCGCCTACAA CCGGCATTCG 
CCCGACTGA

Protein sequence

MVSAVFVPAG VALLTVHETA QQARFYRGAL DEARVHERIS DEVLTDPVLT DVTGDLLADL 
PVDPDLMVDN LQLVVPPSAL RGMTDGVADN VAAYLDGSRA EFVLAVDLRP ILDNIGRLAS 
VYLAGQVSGA PRYRTEDVAA ALRDVLDGVD RVSQGRPPAS VPEIDLTDDQ VAWATDLLVS 
RVDGADRPVA REQVLVALRS GDLGAALAVV GPLIFAGDVS AVADLRSRLA GGTVLDLGRP 
LADAPGGPAG FVLRTIHTIG GTGMLALAAL CFALPAGALG LAVRRRGPSV RLVGAALVAG 
GLSALAAGVL VTGLVGDPLA PLRGPDSPLP PAGRVLAGDV GRVLVANVRA TWSEIAAIPL 
LAGLLLGTVT VVVRRLSRAE WRVRRLVAVG TTCSVFVAVS WVLIPGEAGT GTAFCNGGAD 
LCNRRYSDVV YPTTHNGMAS VQAGFLGAVQ DPDLVGQLDS GIRALMLDVH HWTTPAEVES 
FLAELRPRAR EALAPFATGA RSSRPGLWLC HGICQLGATR LDDALAGVAG WLARNPAEVI 
TIIVQDGVAP EPIMAAFRAA ALGQYLVRPP APGRPWPTLG QLIDRGRRLV VFAENGDVPG 
TWYRNFYRSN ADTPFDVRIP GGFSCRIGRG ASRPTMLLIN HWLTDHAATR ADAALVNTSS 
SLTAHAEQCA ARGLRPTFLA VNFATVGDLV STVAAYNRHS PD