Gene Franean1_5569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5569
Symbol
ID	5675767
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6749091
End bp	6750251
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	71%
IMG OID	641244423
Product	hypothetical protein
Protein accession	YP_001509827
Protein GI	158317319
COG category	[R] General function prediction only
COG ID	[COG3211] Predicted phosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.261658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGACA GGCGCCTGTT TCTGCGGTCC GCATTTGTCG GTGTGGGTGT AGCGACTCTT 
TCCGGTGTCG TTCTGGAGGC CGCTTCGGCG GTTCCGGCGC AGCCCGGGGC CAGCCCGTAC 
GGATCCCTTC TGGCGGCCGA TGCGAACGGA GTGGCGCTGC CGACCGGATT CACCAGCAGA 
ATTGTCGCCC GTTCCGGGCA GACAGTGCCC GGAACGAGCT ATGTCTGGCA TGCCGCACCG 
GACGGCGGCG CCTGCTACCC GAACGGCTCG GGCTGGATGT ATGTCTCGAA CTCGGAGGTG 
AGCGGCAGCG GCGGGGCGTC CGTGCTGCGC TTCCACTCGG CGGGCACCGT CACCTCCGCG 
CAGCGGCTGC TCTCCGGCAC GAGCTCCAAC TGCGCCGGCG GCGCCACCCC GTGGGGGAGC 
TGGCTGTCCT GCGAGGAGAC GTCCACCGGC CGGGTCTGGG AGACCTACCC GGCCACCGGC 
GCCGCGGCCG TCGCCCGGCC CGCGATGGGC CGGTTCACCC ACGAGGCCGC GGCCTGCGAC 
CCGGTCCGCC AGGTGATCTA CCTGACCGAG GACCGGACGG ACGGCTGCTT CTACCGCTTC 
CGGCCAACGA CCTGGGGCAA CCTGGCGACG GGAACCCTCG AGGTCCTGTG CGCGTCGGCG 
TCGGCCACCT CGGGCACCGC CACCTGGCAG ACCGTCCCCG ACCCGGACGG CTCGCCGACC 
TCGACCCGCG CCCAGGTCTC CGCGGCGAAG CACTTCAACG GCGGCGAGGG CGTCTACTAC 
GCGAACAACA CGGTCTGGTG GACCACCAAG GGCGACAACC GGGTCTGGAA GCTGAACTGC 
GCCACCAACG CCTTCGAGCT CGCCTACGAC GACTCCCTGG TGGGCGGGAC CGCGCCGCTG 
ACCGGCGTCG ACAACATCAC CGGCTCCAGC TACGGCGACC TCTACGTCGC CGAGGACGGC 
GGCAACCTCG AGATCTGCGT CATCACGCCG GCCGCGGTCG TGGCGCCGAT CCTGCGCCTG 
ACCGGGCACA ACTCGTCGGA GATCACCGGG CCGGCATTCT CCCCGGACGG CTCCCGGCTG 
TACTTCTCCT CCCAGCGGGG CACCACCGGA TCGTCCTCCG GCGGCATCAC CTTCGAGGTC 
CGCGGCCCCT TCCGCACCTG A

Protein sequence

MVDRRLFLRS AFVGVGVATL SGVVLEAASA VPAQPGASPY GSLLAADANG VALPTGFTSR 
IVARSGQTVP GTSYVWHAAP DGGACYPNGS GWMYVSNSEV SGSGGASVLR FHSAGTVTSA 
QRLLSGTSSN CAGGATPWGS WLSCEETSTG RVWETYPATG AAAVARPAMG RFTHEAAACD 
PVRQVIYLTE DRTDGCFYRF RPTTWGNLAT GTLEVLCASA SATSGTATWQ TVPDPDGSPT 
STRAQVSAAK HFNGGEGVYY ANNTVWWTTK GDNRVWKLNC ATNAFELAYD DSLVGGTAPL 
TGVDNITGSS YGDLYVAEDG GNLEICVITP AAVVAPILRL TGHNSSEITG PAFSPDGSRL 
YFSSQRGTTG SSSGGITFEV RGPFRT