Gene Francci3_1570 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1570
Symbol
ID	3904802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1883592
End bp	1885085
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	67%
IMG OID	637878907
Product	polysaccharide biosynthesis protein
Protein accession	YP_480675
Protein GI	86740275
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.482446
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGCG GCGCCCGGTG GATGTCGGTG AACCAGGTTG TCGTGCAGGT CACCCGCCTG 
CTGGTCCAGG TCGTCCTGGC GCACCTGCTC GAACCGCGGG CGTTCGGTCT CATGACGATG 
GCGCTGGTCA TCGTGATGTT CCTCGAAATT CTGCGGGGTT TCGGGACCGG CATGGCGGTC 
GTCCAACGAG ACAAGATCAG CGAGCGGCTG CTCAGCAGCG TCTTTTTCCT CAATATCGGG 
CTTGGTCTGG TCATCTCGGG CCTGCTGGCG TTGCTGGCGC CCGGCCTGGC CAGCCTGTAC 
GGCGACTCGG CGCTGACGCC CGTGCTCCAG GTCCTGGGCC TCGGCCTGCT GCTCGCCAGC 
CTCGGTGACC TGCAACAGTG GCTGCTCCGC CGGGAGATGA AGTTCGGTGC CGTCGCCGCG 
GCGAACATCA TCGGGACGGC GGCCAACGCG GCCTGCTCGA TCGTGCTCGC TCTGCTGGGC 
TACCAGGTGT GGTCACTGGT CATCGGCTAT CTGGTCGGAT TCGGGGTCAC CACCCTCGTC 
GCGTGGCTGC AGTCGCCGTG GCGTCCCAGG GCCTCGTTCA GCCCCGCCGA GGTCAGGTCC 
GTGCTGCGTT TCAGCGCCAA CCTGAGCGGG TTCAGCGTCT TCAACTTCTT TCTGCTGCAC 
GGCGACAAGG TGATTGTCGG GCATTTCCTC GGAGCCCAGC AGTTGGGCTA CTATGGCCTG 
GCGCAGCGGG TGCTCATGTA TCCGGTGAGC ACTGTTTCCA CGGCGTTTCA GGAAGTCATG 
TTCGCCGGTC TTTCCCGGCT CCAGAACGAT CACTCCGCGA TCCGCCGGGT CTATTTCCGG 
TCATGCGCGG TCGCCGCTCT GGTCTGTTTT CCGGTCATGG CTGGACTCAC TGTCGTCGCG 
CGCGACGTCG TCCTGGTCGT GCTCGGCGCG CGCTGGGAAC GGCTGGTGCC GCTCATCTGG 
CTGCTCGCCC CGATCGGCGG CATCCAGTCG GTGAGTTTCA GCGTCGGAGT CCTCTACAAC 
GTGAAGGGAA GAACCGACCT GCTGCTGCGC TGGGGAATCT TCTCCGGCCT GCTGATGCTC 
GGCAGCTACT TCGCCGGCCT GCCGTGGGGA ATCAACGGGG TCGCGGCGGC GTACGCCATC 
GTGATCGTCC TCCTGCTGCC GCCCGGCTTC GCGATTCCCT TCAGCCTGGT GGACGCGAAG 
CCGCGCGAGC TGGTCACCGC GGTCTGGCCG CACGTCGTGG CGACCGCGGG GACCGTCGCC 
GTGATGGCCG CCGTCCAGTG GCTCACCCAC GGGTTCCGGC TCGCCCGCCC GGTGTGCCTG 
TTGGCGAGCG TGCTGGCTGG TGCCGCGACC TACGTCGTGA TCACGTGGAG GCAACGTCCA 
CCCGCGTTGG CGGACCTACT GCAGTGCGTC CGGCGCGCGA GCGCCGGCTC GGGGCAGCCT 
GCTTCGGCGT CGTCGCGCAG AGACGGCGCG CTGGGCCCGA CGGCTCACGG GTGA

Protein sequence

MASGARWMSV NQVVVQVTRL LVQVVLAHLL EPRAFGLMTM ALVIVMFLEI LRGFGTGMAV 
VQRDKISERL LSSVFFLNIG LGLVISGLLA LLAPGLASLY GDSALTPVLQ VLGLGLLLAS 
LGDLQQWLLR REMKFGAVAA ANIIGTAANA ACSIVLALLG YQVWSLVIGY LVGFGVTTLV 
AWLQSPWRPR ASFSPAEVRS VLRFSANLSG FSVFNFFLLH GDKVIVGHFL GAQQLGYYGL 
AQRVLMYPVS TVSTAFQEVM FAGLSRLQND HSAIRRVYFR SCAVAALVCF PVMAGLTVVA 
RDVVLVVLGA RWERLVPLIW LLAPIGGIQS VSFSVGVLYN VKGRTDLLLR WGIFSGLLML 
GSYFAGLPWG INGVAAAYAI VIVLLLPPGF AIPFSLVDAK PRELVTAVWP HVVATAGTVA 
VMAAVQWLTH GFRLARPVCL LASVLAGAAT YVVITWRQRP PALADLLQCV RRASAGSGQP 
ASASSRRDGA LGPTAHG