Gene Franean1_4235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4235
Symbol
ID	5672590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5043664
End bp	5044926
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	72%
IMG OID	641243108
Product	putative ribonuclease BN
Protein accession	YP_001508525
Protein GI	158316017
COG category	[S] Function unknown
COG ID	[COG1295] Predicted membrane protein
TIGRFAM ID	[TIGR00765] YihY family protein (not ribonuclease BN)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.721564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGCTTG TCTCGCCCGG GTCGAGGCGG TCGCCGCACC GGTCGGCGAT CTGGCCCGGC 
TCGGCGGGAT TTGCGACCCG TCCGGGCGGC AACAACATCG TCATGGTGGG GATGCGCGGG 
AAGCGCGCCG GTGTGGGGGA CAGACGGGGC GGCGAGCCGG CGGACGAGGT GCCCACGCCG 
CGCCCGGCGG ATGACACGAC AGGTCCCGCG GCCAGCGGCG GTACGGCCAG CGGCGGTGCG 
GCGGGGGGCA CGGCCACCGC ACCGGTCCGG CTCGGGCTGC GCTCGTGGTT CTGGGTGCTG 
GTGCGCACAG TCCGTGAGTT CCGCCGGGAC GATCTCCCGG ACCGGGCCGC CGCGCTCACC 
TACTACGGGG TACTCGCGAT CTTCCCCGCG CTTCTCGTAC TGGTCTCGCT GCTCGGCGTC 
GTCGGGCGGC AGGCGACCGA CAGCGTCCTG GAGAACCTGC AGGAACTGAC ACCGGGGTCG 
GCCCGCGACA TCGTGCACGA CGCCGTCACC GGGCTGCGGG ACGCCCCCGG CACGAGCGGG 
CTGCTCGCCG TGCTGGGTCT CGCGGCGGCC CTGTGGTCGG CATCCGGGTA CATCGCGGCC 
TTCATCCGAG CCGCCAACGC CATCTACGAC ATGCCCGAGG GACGTCCCGT CTGGAAGGTC 
GCCCCGCTCC GGCTGGCCGT CACGGTGCTG CTGATGGTCC TGCTGGCCGG GAGCGCCGTG 
ATCGTCGTGT TCAGCGGCGG GCTGGCGCGG CAGGTCGGCC GGATGATCGG CCTCGACGAC 
GCGATGATCA CTCTGTGGTC GGTGGCGAAG TGGCCGGTCC TGGTCCTGTT CGTCGTGGTC 
ATGATCGCGC TGCTGTACTG GAGCACCCCC AACGCCCGGG TCCGCGGCTT CCGCTGGATG 
ACGCCCGGCA GCCTGCTGGC CGTCCTGATC TGGCTGGCGG CGTCCGCGGC GTTCGCCTTC 
TACGTGTCGA ACTTCGGCTC GTACAACAAG ACCTACGGGG CACTCGCCGG AGTGATCGTC 
TTTCTGGTGT GGCTGTGGCT GTCGAACCTG GCGATCCTGC TCGGCCTGGA GTTCGACACC 
GAGATCGCCC GGGGACGGGC GATCTCGGTG GGCCACCCGG AGGATCTCGA GCCCTACGTC 
GAACCCCGTG ACACCCGTGC CTGGCCCAAG GAGATGAAGG CGTCCCTGCC GGCGAGGCGG 
CGCCGGTCCT GGCTGCCCGG CCGGTGGTCC CGCCGCCGCA TGGCTGGCGC TGCCGAGAGC 
TGA

Protein sequence

MGLVSPGSRR SPHRSAIWPG SAGFATRPGG NNIVMVGMRG KRAGVGDRRG GEPADEVPTP 
RPADDTTGPA ASGGTASGGA AGGTATAPVR LGLRSWFWVL VRTVREFRRD DLPDRAAALT 
YYGVLAIFPA LLVLVSLLGV VGRQATDSVL ENLQELTPGS ARDIVHDAVT GLRDAPGTSG 
LLAVLGLAAA LWSASGYIAA FIRAANAIYD MPEGRPVWKV APLRLAVTVL LMVLLAGSAV 
IVVFSGGLAR QVGRMIGLDD AMITLWSVAK WPVLVLFVVV MIALLYWSTP NARVRGFRWM 
TPGSLLAVLI WLAASAAFAF YVSNFGSYNK TYGALAGVIV FLVWLWLSNL AILLGLEFDT 
EIARGRAISV GHPEDLEPYV EPRDTRAWPK EMKASLPARR RRSWLPGRWS RRRMAGAAES