Gene Francci3_1184 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1184
Symbol
ID	3903458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1416444
End bp	1417682
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	68%
IMG OID	637878516
Product	glycosyl transferase, group 1
Protein accession	YP_480292
Protein GI	86739892
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGATCG TCTTCTTGTG CGAGCAGTAT CCGCCGATCA TCTGGGACGG GGCGGGAGTC 
TACACACACG ACATCGCTCA CGCCCTGGTC GCGCTCGGTC ATCGGGTTCA TATCCTTTGC 
GCCCAGGGGC GCTACCGCAC GGACGAAGAT CATGACGGAG TGATGGTGCA CCGGCGGCCG 
CTCCTGCGGT TGCCCGTCAC CAGGTTTCTC GGTCCGCTCG GCCGGTCGTT TCAGGGGGAG 
AACCATCCTC GCGATTCGCT CTCCCTGCGG TTCGTTCTCG CGGTCTCCTA TGCTTTTTGG 
CTGCGTCGTC TCGGTCTGCG TCCCGACGTG ATCGAGACTC AGGACGGCGA GACCCGGGGC 
CTGCGTACCG CCCTGCGCCG CGATATTCCC CTCGTGATCC ACCTGCACAC CCCGACGATG 
ATGGACGTGC GTCTGCGGGA CGGCCGGCTG CACGGCAGGG GCGCGGTGGC CGACCGGATC 
GACCGGTTCT CCGCGCTGCG CGCCGACGCG CGCACCGCTC CCTCCGAGCT GATCGTCACC 
ACGCTGCGCG GTTTCGGCTG GCTGGATAAG GACACCGACG CGGACGTCAT TCCTTACCCG 
TTCGACCGGT CCCCGTACAT GGAGGTGGCT TCGCCCCGGC ACACCGACCC GACGTTGCTC 
GTCGTCGGAC GGCTCGAATG GCGCAAGGGG CTGGACGTCC TGATCGAGGC GGCCGCGCTG 
CTGAAGAAAC GGGGTGTCGA GGTAACGGTG GTCTTCGCCG GTCAGTCCTC GGGCACGATC 
GAGGGCGTGG CGACCGGGAC CTGGCTGGAG CAGCAGGCGG TCAAACTCGG CGTCACCTGC 
CGTTTCGCCG GCCACCTGAC CCGTCCCGAG CTGGTCAAGG CCTATGAGGA GGCACGGGTG 
GTCGTCGTGC CGAGCCGGTT CGAGAGCTTC TCCATCGCGG GTCTCGAAGG AATGGCCTCG 
GGACGCCCGG TCGTCGCGAC CGCGACGACC GGGGTGGCCA CCTGGGTGGC GAAATGGAAG 
GGCGGCACGG TCGTTCCGCC GGAGGACGCC CCCGCACTCG CCGACGCCCT GGAACCTTTC 
CTCACCGACC CGGAGCTCGC GGAGACGGTG GGTGCCCGCG GTCGGGTCGG CACCGCCGAG 
CTCGAGCCGC TGCGTATCGC CGCCCTGCGG GAGAAGGTCT ACCAGAAGGC CATCGACCGT 
TTGCGGGCGC GCCACGGAAA AACCTCCGCC GTGGCATGA

Protein sequence

MEIVFLCEQY PPIIWDGAGV YTHDIAHALV ALGHRVHILC AQGRYRTDED HDGVMVHRRP 
LLRLPVTRFL GPLGRSFQGE NHPRDSLSLR FVLAVSYAFW LRRLGLRPDV IETQDGETRG 
LRTALRRDIP LVIHLHTPTM MDVRLRDGRL HGRGAVADRI DRFSALRADA RTAPSELIVT 
TLRGFGWLDK DTDADVIPYP FDRSPYMEVA SPRHTDPTLL VVGRLEWRKG LDVLIEAAAL 
LKKRGVEVTV VFAGQSSGTI EGVATGTWLE QQAVKLGVTC RFAGHLTRPE LVKAYEEARV 
VVVPSRFESF SIAGLEGMAS GRPVVATATT GVATWVAKWK GGTVVPPEDA PALADALEPF 
LTDPELAETV GARGRVGTAE LEPLRIAALR EKVYQKAIDR LRARHGKTSA VA