Gene Franean1_6665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6665
Symbol
ID	5674980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8095408
End bp	8096709
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	75%
IMG OID	641245516
Product	glycosyl transferase group 1
Protein accession	YP_001510908
Protein GI	158318400
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.143503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.818272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGTGA ACGGGGGCGA CGGTGAAGCC CCGGTGAGCG GGGGCACGGC AGGCGGGAGC 
TCGGCGGGCG GCCCGCTCTC AGTGGCGTTG CTGACCTATT CCACCCGGCC CCGCGGCGGG 
GTGGTGGCCA CCCTCGCGCT GGCCGAGGCG CTGGCGCGCG CCGGGCACCG CGTCAGCCTG 
TGGACGCTGG CCCGCGGCGG GGACGCCGGC TTCTTCCGCC CGGTCGACCC GGCGGTCGAG 
GTGGTGGCGG TGCCGTTCCC GGAGGTCGCC GACGAGACGG TCGGGAAGCG CATTATACGC 
TCGATCGCCA TCCTCCGGGA TGCCTTAGAG GCGTTTCCCG GCGGGTACGA CATCGTGCAC 
GCCCAGGACT GCATCGCCGC GAACGCCGTG GCCGACTGCG TCCGCACTGT CCACCACCTG 
GACACCTTCA CCACCCCCGA GCTCGTCGCC TGCCATGAGC GGGCGCTGCG CCGGCCGTAC 
GCGCACGTGT GCGTGTCGGC GGCCGTCGCG GTCGAGCTGG CCGCCGGCTG GGGGATCACC 
GCGACGGTGA TCCCGAACGG CGTCGACGCG GCCCGCTTCA CCGCGGCTGC CGGCCCGGAG 
GCTCCCGCCC GCGAGGCCCG CGGGCGCTGG CGTGCCCGGC TCGGCCGGTA CGTGCTCGCC 
GTCGGCGGGA TCGAGCCGCG TAAGGGGACC GCCGACCTGG TCGAGGCGTT CGCGCTGCTG 
CGGGAGCGGG TGACGCCGGT TTCCCTCGTC GTCGCCGGTG GGGAGACCCT GTTCGACTAC 
CGCGGGTACC GCGAGCAGGT GCTGGGCCGG GCCGCGCAAC TCGGCGTCGA GCCCGTCATC 
CTCGGGCCGG TGGCCCACGA GGAGCTGCCC GCCCTGGTCG CGGCGGCGGA CGTCTTCGCG 
TTCCCGTCCG CGAAGGAGGG GTTCGGGCTG GCCGCGCTGG AGGCGCTGGC CGCGGGTGTC 
CCGGTCGTCA CCCGTGACCT GCCGGTGCTA CGCGAGGTGC TGGCCGCGGC CGGGGACGCG 
GTGTGCTTCG CCTCGACGCC GACCGAGTTC GCGGCCGCGC TGGAGGCGTT CCTCGACTCC 
GCGCAACGGC GGCCGGCCGC GGGCGCCGAG CAGCCGCAGG CGGGAGCGGG CGCCGGACAT 
CCGCGGGTGG CGGCCGGGCG GGCAGTCGCG CGAGGGTACA GCTGGGCGAC CGCGGCCGAC 
CGGCATGTCG CCCTTTACCG CGAACTGATC AGAACACAGG TCACCGGACG GCCGACGCGC 
CGAATCAGCG TCACCACAGA TAAATCATCC ATCTCATTGT AA

Protein sequence

MTVNGGDGEA PVSGGTAGGS SAGGPLSVAL LTYSTRPRGG VVATLALAEA LARAGHRVSL 
WTLARGGDAG FFRPVDPAVE VVAVPFPEVA DETVGKRIIR SIAILRDALE AFPGGYDIVH 
AQDCIAANAV ADCVRTVHHL DTFTTPELVA CHERALRRPY AHVCVSAAVA VELAAGWGIT 
ATVIPNGVDA ARFTAAAGPE APAREARGRW RARLGRYVLA VGGIEPRKGT ADLVEAFALL 
RERVTPVSLV VAGGETLFDY RGYREQVLGR AAQLGVEPVI LGPVAHEELP ALVAAADVFA 
FPSAKEGFGL AALEALAAGV PVVTRDLPVL REVLAAAGDA VCFASTPTEF AAALEAFLDS 
AQRRPAAGAE QPQAGAGAGH PRVAAGRAVA RGYSWATAAD RHVALYRELI RTQVTGRPTR 
RISVTTDKSS ISL