Gene Franean1_2160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2160
Symbol
ID	5670560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2590153
End bp	2591706
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	71%
IMG OID	641241081
Product	glycosyl transferase group 1
Protein accession	YP_001506502
Protein GI	158313994
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCAGACG ACTCCCGCCC ATCGCCCGTC GCCCCGGCGC GGCCATGGCC GTCCACGACC 
AGGTCGGCGC CAACGCCGTC GCGGCAGGTC AGCAGCGGCC CCCCCAGTGG ATGGCCACGC 
ATCCTGCTCG TGACGCACTA TTTCCCCCCC GAGGTCGGGG CACCGCAGGC CCGGCTCTCG 
GAGACGGCGC GGGCCTGGGC ACAGGCCGGC GCGGATGTCA CCGTGCTGAC CGGCATGCCC 
AACCATCCGA CCGGCATCGT GCCACCGTCC TACCGCGGCG CGGCCCGGCG AGTGGAGCAC 
AGCGACGGCT ACCGGATAGT GCGGACCTGG CTTTATGCGA CCCCGAACGA AGGCGTGCTG 
CGCAAAACGA TCGGCCACAT CTCTTTCACA CTCAGCTCGG TACTGCTGGG CGGCCGGCTC 
GCCGGGCCGG CTGACGTCGT CGTCGTCTCC TCGCCCACGT TCTTCCCCCT GGGCTCGGCG 
TGGTGGCTGG CCCGCCGATG GCGGGCCCGG CTAGTCGTCG AGGTACGGGA CCTGTGGCCG 
GCGATCTTCA CTCAGCTCGG AGTGATCAAG AACCGCCGCG TCATCGCCGC GCTGGAACGA 
CTGGAGCTGG CCGCATACCG GGCCGCGGAC GCGGTTGTCA CCGTAACCGA CGGATTCCGG 
GACGACATCG TGCGCCGCGG CATCCCGGCG GAAAAAGTAC ACGTCATTCC CAACGGCGTG 
GACCTCGACC GCTTCCAGCC GGGCGAACCG GCATCCGCCG AGGTACGGGC GAGGCTGGGA 
GCCGGCCCGG ACGACATTCT CGTGCTGTAC GTCGGCGCAC ACGGCATCTC GCAGGGGCTC 
ACCTCGATCG CGGACGCCGC GGCCCGACTG GCCGAGAAGG CTCCGGCGAT CCGATTCGCC 
TTCGTAGGCG AGGGAGCCGA CAAGCAGCGG CTGACCGACC ATGTCGGGCA GCTCGGCCTG 
ACAAACACCA CCCTGGCGCC GGCGGTCCCT CGCGCGGACA TGGCCACGCT TCTCGCCTCC 
GCCGACATCT GCCTGGTCCC GCTGCGGGAC GTGCCGTTGT TCGACACCTT CATCCCGTCG 
AAGATGTTCG AGCTGCTGGC GGCGGGGCGC CCGGTGATCG GCTCGGTGCG CGGCGAGGCG 
GCCCGCATAC TCGCCGAGGC CGGCGCGGTC GTGGTGCCTC CTGAAGACCC TGACGCGCTC 
GCCGAGGCAG TGTTGGATGC GGCAACCGAT CCGGGGCGGG ACGTCGACAT GGGCCGCACG 
GCCCGTCAGT ACGTCGCACA ACACTTTGAC CGGTCGATGC TGGCCCAGCG CTACCACGAC 
CTGCTCCTGG GACTCCTGAC CGGGCGGCCG GGCGACGCGG TGTCCAGGGA TGAGGCGGCC 
CTGGGCCCAG GGTCGCCGCG AGACCAGGGG GCGCGCAACG AACCGGGTCA GGAGCGCGTG 
GTCGCTCCGA TGCCGCCGTT GGAGGAGCAG TCACCGGTTC CCAGTCCCCG CCCCGCTCGC 
CCCGGACCGA CGGACCCACA TCTCGCGATC GACACCCGAG GGAGATCGGC ATGA

Protein sequence

MPDDSRPSPV APARPWPSTT RSAPTPSRQV SSGPPSGWPR ILLVTHYFPP EVGAPQARLS 
ETARAWAQAG ADVTVLTGMP NHPTGIVPPS YRGAARRVEH SDGYRIVRTW LYATPNEGVL 
RKTIGHISFT LSSVLLGGRL AGPADVVVVS SPTFFPLGSA WWLARRWRAR LVVEVRDLWP 
AIFTQLGVIK NRRVIAALER LELAAYRAAD AVVTVTDGFR DDIVRRGIPA EKVHVIPNGV 
DLDRFQPGEP ASAEVRARLG AGPDDILVLY VGAHGISQGL TSIADAAARL AEKAPAIRFA 
FVGEGADKQR LTDHVGQLGL TNTTLAPAVP RADMATLLAS ADICLVPLRD VPLFDTFIPS 
KMFELLAAGR PVIGSVRGEA ARILAEAGAV VVPPEDPDAL AEAVLDAATD PGRDVDMGRT 
ARQYVAQHFD RSMLAQRYHD LLLGLLTGRP GDAVSRDEAA LGPGSPRDQG ARNEPGQERV 
VAPMPPLEEQ SPVPSPRPAR PGPTDPHLAI DTRGRSA