Gene Franean1_4211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4211
Symbol
ID	5672566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5015211
End bp	5016524
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	77%
IMG OID	641243084
Product	hypothetical protein
Protein accession	YP_001508501
Protein GI	158315993
COG category	[S] Function unknown
COG ID	[COG1641] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00299] conserved hypothetical protein TIGR00299

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.636421
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGCA ACACGTCCAC CGGGGTCGTC GGCTGGCTCG ACGCGACCGG CGGGATCAGC 
GGCGACATGC TCCTCGGTGC CTGCCTGGAC GCCGGGGTCG ACCTGGCCGT GCTGCGGGCC 
GCCGTCGCGG CGCTGCGCCT GCCCGACGAG GTGCGGCTGG ACGCGCGGAC CGTGCAGCGC 
GGGGGGCTGC GGGCGTCCCA GGTTCTGGTG CGGTGCGCGC CGAGCCCGCA CGCGCGCGGG 
CTCGCCGACG TCCTTGGGCT GCTGGATGCC GCCGACCTCG ACCCGGTCGT ACGGGCCCGG 
GCCGCGGACG TGTTCCGCGC GCTGGGGGCC GCCGAGGCGC GGGTGCACGG TCGTCCCATC 
GAGCAGGTGC ACTTCCACGA GGTCGGCGCG CTCGACAGCC TGGCGGACGT CGTCGGCGCC 
GTCGCCGGCC TGCACGCGCT CGGGATCGAC CGGCTCGTGT GCAGCCCGAT CTCGCTGGGC 
GGCGGGCGGA TCAGCGCGGC GCACGGGGCC ATCCCGTTGC CCGGGCCGGC CGTCCTGGAG 
CTGCTGCGGG CGGCCGGGGC GCCGGCGTCG GGCGGCCCGG TGGAGACCGA GCTGGCGACG 
CCGACCGGGG TGGCGCTCGC CGTCACGCTC GCCGAGGAGT TCGGTCCGAT GCCGCTCATG 
CGCACCACGT CGATCGGGCT GGGTGCCGGC GGGCGGGATC TCGACGGGCA TCCGAACGTG 
ACCCGGCTGG TCGTCGGCCG GGCCGACCTG GCGGGGCCGG CGGCGGCGCA CGGGGCCCGC 
CACGGCGACA GCGTCGTGCT GGAGACGAAC GTCGACGACC TGGACCCGCG GCTGTGGCCG 
TCGACGCTGC GGGCGCTGCT CGCCGGCGGC GCGGCGGACG CCTGGCTGAC CCCGATTCTG 
ATGAAGAAGG GCCGGCCCGC GCACGTCCTG TCGGTGCTGT GCGAGCCCGC CGCGGCCGAC 
CGGCTGCGAC AGGTGATCTT CAGCCACACG ACGTCGATCG GGGTCCGCGA GCACACGGTG 
ACGAAGTCCG CGCTGGCCCG CCGCGAGCTG CGGGTGGCGG TGGCGGGCGG GGAGGTGCGG 
GTGAAGGTCG CCTCGTCGCG TGGTGCCGTC GTCAACGCCT CGGTGGAGTA CGACGACGTG 
GTCGCGGTGG CGGCGGCGGC CGGGCTGCCC CCGAAGGTGG TCCTGGACCT GGCCCGGGCG 
GAGGCCGCGC AGGCCCACTC CCCCGCAGCC CCCGGGAACG AGTTTCCGAC GGTCGAGCAC 
CCCGGGGCCC ACGGGCACGG CCGGCCGGGT CAGCCGGGCC GTCCGCCGGG CTGA

Protein sequence

MTGNTSTGVV GWLDATGGIS GDMLLGACLD AGVDLAVLRA AVAALRLPDE VRLDARTVQR 
GGLRASQVLV RCAPSPHARG LADVLGLLDA ADLDPVVRAR AADVFRALGA AEARVHGRPI 
EQVHFHEVGA LDSLADVVGA VAGLHALGID RLVCSPISLG GGRISAAHGA IPLPGPAVLE 
LLRAAGAPAS GGPVETELAT PTGVALAVTL AEEFGPMPLM RTTSIGLGAG GRDLDGHPNV 
TRLVVGRADL AGPAAAHGAR HGDSVVLETN VDDLDPRLWP STLRALLAGG AADAWLTPIL 
MKKGRPAHVL SVLCEPAAAD RLRQVIFSHT TSIGVREHTV TKSALARREL RVAVAGGEVR 
VKVASSRGAV VNASVEYDDV VAVAAAAGLP PKVVLDLARA EAAQAHSPAA PGNEFPTVEH 
PGAHGHGRPG QPGRPPG