Gene Franean1_5894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5894
Symbol
ID	5674216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7157747
End bp	7158895
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	79%
IMG OID	641244743
Product	glycosyl transferase group 1
Protein accession	YP_001510145
Protein GI	158317637
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.262799
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.416223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGAAAC TGCGCGTCGT CCTCGACGGA ACCCCGCTGC TCGGGCCGCG CACCGGCGTC 
GGCCGATACA CGGCGGCGCT GCTGGCCGGC CTCGTCGAGC TGCCCGGGGC GGATCTCGAC 
GTGGCGGCCA CCGCCTTCAC CTGGCGCGGC GGGGCGGGGC TCGACGCCGC CCTGCCCGCC 
GGGGTCCGCC CGGCGGCGCG GCGCGTCCCG GCGCGGCTGC TACAGGACGC CTGGACACGC 
TCGGAGCGCC CGCCCACCGA GTGGCTCACC GGGCGGGCGG ACATCGTGCA CGGGACGAAC 
TTCGTCCTCG GCCCGCTGTC ATCGGCGCGC GGTGTGCTGA CCGTGCACGA CCTGTCGTAC 
CTGCGTACCC CGGACACGGT GTCGGCTGCC TCCGCGCGCT ACGCGACGCT GGTGCCGCGC 
GGGCTGCGCC GCGCCGCCGC GGTGCTCACC CCCAGCCGCG CCGTCGCCGA CGAGGTGATC 
GCCGCCTACC GGCTCGACCC GGACATGGTC ACCCCGACCC CGCTCGGCGT CGACGCCGCC 
TGGTTCGACG CCGCTCCCCC GGCCCGCGGC TGGCTCGCCG CGCGCGGGCT GCCCGAGCGG 
TACCTGCTGT TCGTCGGGTC GGCGGAGCCG CGCAAGAACC TGCCGGTGCT GCTGGAGGCG 
CTGCGCCGGC TGCGCGCCGA CGCGCCCGAC ACCCCGCCGC TGGCGCTCGT CGGCCCGCCC 
GGCTGGGGCC CGGCGCTCGA CACCTCGGGC CTGCCCGCGG ACGCCGTCGT CACCGTCGGC 
TACCTCGACG ACGCCGAGCT GCGCTCCGTG GTCGCCGGCG CGGCCGCGCT GTGCTTCCCG 
TCCCGCTACG AGGGCTTCGG GCTACCGCCG CTGGAGGCGC TGGCCGCCGG TACCCGGGTC 
GTGGCCGCCG ACATCCCCGC GGTGCGCGAG GTGGTCGGCG CCGCCGCCGG TGTCCGCCTG 
GTCACCCCCG GCCGGTGGGA CGTCTTCGCC GACGACCTCG CCGGAGCCCT CGGCGCCGCG 
CTCGCCGAAC CGACCGGCAC CGCCCAGTCC GCCACCCAGG CCGCCGCCGG CCGCGAGCAC 
GCCCGCGCGT TCACCTGGCG GCGCACCGCC GAGCTGACCG CCGCCGTCTA CCGCCGCGTC 
GCCGGCTGA

Protein sequence

MPKLRVVLDG TPLLGPRTGV GRYTAALLAG LVELPGADLD VAATAFTWRG GAGLDAALPA 
GVRPAARRVP ARLLQDAWTR SERPPTEWLT GRADIVHGTN FVLGPLSSAR GVLTVHDLSY 
LRTPDTVSAA SARYATLVPR GLRRAAAVLT PSRAVADEVI AAYRLDPDMV TPTPLGVDAA 
WFDAAPPARG WLAARGLPER YLLFVGSAEP RKNLPVLLEA LRRLRADAPD TPPLALVGPP 
GWGPALDTSG LPADAVVTVG YLDDAELRSV VAGAAALCFP SRYEGFGLPP LEALAAGTRV 
VAADIPAVRE VVGAAAGVRL VTPGRWDVFA DDLAGALGAA LAEPTGTAQS ATQAAAGREH 
ARAFTWRRTA ELTAAVYRRV AG