Gene Franean1_0858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0858
Symbol
ID	5669274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1004665
End bp	1005849
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	73%
IMG OID	641239787
Product	hypothetical protein
Protein accession	YP_001505222
Protein GI	158312714
COG category	[S] Function unknown
COG ID	[COG3503] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.581256
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.122318
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGCG CGAACCCTGC AGGAACCGGA CGGATAACCG GGGTCGACAT CGCTCGCGGC 
GTGGCGCTGC TCGGCATGGT GGCGACCCAC GTCTATCCCC CGTTCACCGA CACCGCGTCG 
GACGACCCGG CGGTCTCGCC CGCGTTCATC CTGGCCGCGG GGCGGGCCGC TGCCGCGTTC 
GCCGTACTCG CCGGTGTGGC TCTGGTGTTG TCCACCCGAC GGCAGAGCGC GGGCCAGGCC 
CGGCTCTCGG TGTTCCTGCG GGCGCTCGGC ATCGGGGCAC TCGGCCTGGG CCTCGCCTAT 
GCCGACTCTG GTATCGCCGT GATCCTGGTC TACTACGCGC TGTTGTTCGT CCTGGCGCTG 
CCGCTGCTGC GGGCATCCGT GCCGGTACTG ATGACGGTCG CCGTCCTGGC GATCTTCGCG 
GAGCCCGTCG TCAGCCAGTT CGTGCGCGGT GACCTGCCCG AGTCGGACCT GTCGTCGCCC 
ACGTTCGCCG CGCTGGGCGA GCCGGGCCAT CTCCTCGCGA AGCTGGCGAT CACCGGGGTC 
TACCCCGCGT TCGCCTGGCT GGGCTACATC TGCGTCGGGA TGGCCGTCGC CCACGCGGAC 
CTGCGCTCAC GCCGGGTGGC GACCCGGCTG CTCGTCGGCG GCCTGGCGCT CGCCCTTGCG 
GCGGCGGCCG CGTCCTGGCT GCTGTTGGAG CCGCTCGGCG GGCGCGCCGA GCTCGCCAAC 
CCGGCCGAGG TTCCCGGTGT GGGCTCACTG CCGCAGGGCT GGTTCATCGA TTCCGGGCTG 
TACGGCGCGA CGCCCACCGA CAGCGCCTGG TGGCTGGCCG TCGACACGCC GCACTCGACG 
ACTCCGTTCG ACCTGGCGCA CACCACCGGG ACGGCACTGG CGCTACTCGG CCTTGCCCTG 
CTGGTGGCGC GGGTACCGCT GGTCCGGCCA CTCGCGGCCG TCGGCGCGAT GACGCTCACC 
TTCTACTCGC TGCACGTGGT GGTGATGGCC ACCGGCGTGC TGCCCACCGA TCCGACCAGG 
TCGTATGTGC TCCAGGTGGT CGTCGCGCTC GCGGCCGCGA CGCTCTGGCA CATGACCGGC 
CGGCGCGGCC CGGCCGAGGC CGCCGTCTCG GTGCTCCCCC GGGCGGCCCG GCTCGTCCAG 
GCCCCGCGGC GACCCGCGGT CGGGCTCGAG CGAGGAACTG GCTAG

Protein sequence

MDGANPAGTG RITGVDIARG VALLGMVATH VYPPFTDTAS DDPAVSPAFI LAAGRAAAAF 
AVLAGVALVL STRRQSAGQA RLSVFLRALG IGALGLGLAY ADSGIAVILV YYALLFVLAL 
PLLRASVPVL MTVAVLAIFA EPVVSQFVRG DLPESDLSSP TFAALGEPGH LLAKLAITGV 
YPAFAWLGYI CVGMAVAHAD LRSRRVATRL LVGGLALALA AAAASWLLLE PLGGRAELAN 
PAEVPGVGSL PQGWFIDSGL YGATPTDSAW WLAVDTPHST TPFDLAHTTG TALALLGLAL 
LVARVPLVRP LAAVGAMTLT FYSLHVVVMA TGVLPTDPTR SYVLQVVVAL AAATLWHMTG 
RRGPAEAAVS VLPRAARLVQ APRRPAVGLE RGTG