Gene Franean1_6549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6549
Symbol
ID	5674864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7965342
End bp	7966625
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	71%
IMG OID	641245398
Product	glycosyl transferase group 1
Protein accession	YP_001510792
Protein GI	158318284
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.245344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACCGC TACTGACACC ACTGGCGACG GACCTCGACG GCCACGGCCA CGGCCCGGCG 
GGCCCGCCGG CGAACCGACC GATGGCGCAG CCGCTCCGGG TCCTCTACAG CTTCCCGCAT 
CCGCTCGGTC TACCCGGGAT CGGCACGACT GCCTACCACC AGGTCATCTC GCTGTGGCGA 
CAGGGCATCG AGGTGCAGGT CTACTGCACG AGCGTCGCTC GTCCGCTCCC CCCTGGCCTG 
CCGGTGCGCC AGACGATGGC GCTCGGGGGG CAACGCCTGC CGCCCAGAGC GGTCGGAGTG 
AAACGCGCCA GGTACTGGCA CGACCGGGTG GTGGCGACCG CACTGGCCCG GGAGTACTTC 
GATGTCGCGC ATGTCTGGCC AGGTGCTGCC GTTCACACGC TGCGCGCATG TCGACGACTG 
GGCATCCCGG GACTGCGCGA GGCCCCCAAC ACCCACACCG CCCATGCCTG TGACGTTGTC 
GCTCGGGAGA CGGCACGCCT GGGTCTGACC ATGCAAAGGA ACTCCAGCCA TGCGCCGAAC 
CCGCGTTCGC TGCGGCTGGA AGACGCCGAG TACGGCGCGG CGACCGCGCT GCTGGTCCCG 
TCCGATGTCG CCGCCGAGAC GTTCGTGGGA CGAGGTATGC CGGCCGGCCG GCTCGTCCGG 
CATCGGTACG GGTTCGATCC GCGCACATTT CCGGCGCCCC GGGCCGAGGA GATGGAAAGA 
CCAGGCACCC GGCCACTGCA TGTGGTCTTC GTGGGCCGGT GTGAGCCACG CAAGGGACTG 
CATCTACTGC TCGAGGCCTG GCGGAGGTCG GGTCTCGCGG GACGGGCCCG CCTGACGATC 
TGCGGGTCGT TCTGGTCCTC GTACCGAGCC CTGCTCGCTC CCGCACTGGC CCAGCCCGGT 
GTCGAAACAC CCGGTTTCGT AACGGACGTG CCGGGCCTGC TGCGGTCCGC CGACGTGCTG 
GCCCTTCCCT CCCTGGAAGA GGGCAGCGCG CTGGTCACCT ACGAGGCCCA GGCGAGCGGG 
TGCGCGCTGC TGGTTTCCCG GCAGTCCGGT GCCGTCCTCA CCCATGGTGA GCAGGGGCTG 
CTGCACGAGG CGGGCGATGT CGACACGCTG GCCGCGCACC TGCGGCAGCT GGAACACGAC 
CGGAGCCTGC TCGAACGGCT ACGCTGCCGA GCCCTGGCCG CGCGGAAGTC GCTGACCTGG 
AACCACGCCG GAACCATTCT CCACGCGGCC TATGAGCGGT CCAGGGCGGC CGCGGTAGAC 
GGCGCGGGGA CGGACGCGGC ATGA

Protein sequence

MTPLLTPLAT DLDGHGHGPA GPPANRPMAQ PLRVLYSFPH PLGLPGIGTT AYHQVISLWR 
QGIEVQVYCT SVARPLPPGL PVRQTMALGG QRLPPRAVGV KRARYWHDRV VATALAREYF 
DVAHVWPGAA VHTLRACRRL GIPGLREAPN THTAHACDVV ARETARLGLT MQRNSSHAPN 
PRSLRLEDAE YGAATALLVP SDVAAETFVG RGMPAGRLVR HRYGFDPRTF PAPRAEEMER 
PGTRPLHVVF VGRCEPRKGL HLLLEAWRRS GLAGRARLTI CGSFWSSYRA LLAPALAQPG 
VETPGFVTDV PGLLRSADVL ALPSLEEGSA LVTYEAQASG CALLVSRQSG AVLTHGEQGL 
LHEAGDVDTL AAHLRQLEHD RSLLERLRCR ALAARKSLTW NHAGTILHAA YERSRAAAVD 
GAGTDAA