Gene Franean1_4881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4881
Symbol
ID	5673221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5854500
End bp	5856224
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	69%
IMG OID	641243736
Product	hypothetical protein
Protein accession	YP_001509152
Protein GI	158316644
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.352263
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.244213
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGAAGAC GGACACGCAG CCCAGCGGCC GTCGAACAGG CTGACGGGCC GCCACGTCGC 
CGATCACCCG AATGCCGGCA CCCGCGGGGC TGTCGGCGTG GCGGGGGAGG TCTCCGGGCG 
TTCCCGAAGC TTCCCGGCAA GAGGTTCGGA ACGACCAAGG GCGGCGTCCG GCCGACCCGG 
CGGCCCGCCA GCACCTACGC TTGCAGAGTG AGCGTGCGCC GGATCATGGG GACCGAGACC 
GAATACGGCG TGTCCGTGCC CGGTCAACCC AACACAAACC AGATGCTGGC TTCGTCGTTG 
GTCGTGAACT CTTACGCCAA CAGGGCCGCC ACCGGGGGCA GTCGAGCTCG GTGGGACTTC 
GAGGAGGAGT CCCCCCTGCG AGACGCCCGC GGCTTCGAGC TGCCCAGGGA GCCGGTGGTC 
GATCCTGGCG CGCCCGCGAA CGAGGACGAC CTCGGGCTGG CCAACGTCAT CCTGACCAAC 
GGCGCGCGCT TCTACGTCGA TCATGCGCAC CCCGAGTTCT CGACCCCCGA GGTGACGAAC 
CCGCGCGACA TCGTCCTCTG GGACAAGGCG GGGGAGCGGG TGATGGCAGA GGCGGCCCGC 
CGTGCGCTGA CTGTCCCCGG CACGATGCCC GTGCACCTGT ACAAGAACAA CACCGACAAC 
AAGGGTGTCT CCTACGGCTG CCATGAGAAC TACCTCATGG CGCGGGCGAC CCCGTTCGGG 
GAGATCGTGC GGCACCTGAC GCCGTTCTTC GTCTCCCGCC AGGTGATATG CGGCGCCGGC 
CGGGTCGGCA TCGGCGTGGA CGGGCGTGAG CCCGGGTTCC AGATCAGCCA GCGCTCGGAC 
TTCTTCGAGG TCGAGGTCGG ACTGGAGACC ACCCTCAAGC GCCCCATCAT CAACACCCGG 
GACGAGCCCC ACGCCGACCC GGAGAAGTAC CGGCGTCTGC ACGTGATCAT CGGTGACGCC 
AACATGAGCG AGATCGCCAC CTACCTCAAG GTGGGGATGA CCTCGCTCGT CCTGGCCATG 
ATCGAGGAGG GCTGGCTCCA GGTCGACCTG TCGGTGGACG CGCCGGTCGC GACGCTGCGG 
GCGATCTCCC ACGACCCCTC GCTGCGGTAT CTGCTCACCC TGCGCGACGG CCGGAAGATG 
ACCGCCGTGC AGCTCCAGAT GGAGTACTTC GAGCAGGCCC GCAAGTTCGT CGAGGACAGG 
CTCGGCACGG ACGTCGACCC GCAGACGGCC GACGTGCTCT CCCGGTGGGA GTCGGTGCTC 
GGCCGCCTCG AGGTCGACCC GATGACCTGC TCGCGGGAGC TCGACTGGGT GGCCAAGCTG 
TCGATCATCG AGGGCTACCG CTCCCGTGAC GCCCTGGCAT GGGACTCGCC GCGGCTGCAG 
CTCGTCGACC TCCAGTACCA CGACGTGCGG CCGGAGAAGG GCCTCTACAA CCGCCTGGTG 
GCCCGGGGCC GCTTCGACCT CCTCCTGAGT GAGGAAGAGG TCACCAGGGC GATGACGGAG 
CCTCCGGAGG ACACCAGGGC GTACTTCCGG GGGCGCTGCC TGGAGCTCTA CCCGCAGCAG 
GTGGCGGCCG CTTCCTGGGA CTCGGTCATC TTCGACATCG GGCGGGACTC GCTGCAGCGG 
GTGCCGACCC TTGAGCCGCT GCGTGGCACC AAGGCGCACG TGGGCGAGCT GCTCGCCCGC 
TGCCCCACCG CCGCCGACCT GGTGGACGCC CTGTCGGGTA ACTGA

Protein sequence

MRRRTRSPAA VEQADGPPRR RSPECRHPRG CRRGGGGLRA FPKLPGKRFG TTKGGVRPTR 
RPASTYACRV SVRRIMGTET EYGVSVPGQP NTNQMLASSL VVNSYANRAA TGGSRARWDF 
EEESPLRDAR GFELPREPVV DPGAPANEDD LGLANVILTN GARFYVDHAH PEFSTPEVTN 
PRDIVLWDKA GERVMAEAAR RALTVPGTMP VHLYKNNTDN KGVSYGCHEN YLMARATPFG 
EIVRHLTPFF VSRQVICGAG RVGIGVDGRE PGFQISQRSD FFEVEVGLET TLKRPIINTR 
DEPHADPEKY RRLHVIIGDA NMSEIATYLK VGMTSLVLAM IEEGWLQVDL SVDAPVATLR 
AISHDPSLRY LLTLRDGRKM TAVQLQMEYF EQARKFVEDR LGTDVDPQTA DVLSRWESVL 
GRLEVDPMTC SRELDWVAKL SIIEGYRSRD ALAWDSPRLQ LVDLQYHDVR PEKGLYNRLV 
ARGRFDLLLS EEEVTRAMTE PPEDTRAYFR GRCLELYPQQ VAAASWDSVI FDIGRDSLQR 
VPTLEPLRGT KAHVGELLAR CPTAADLVDA LSGN