Gene Franean1_3324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3324
Symbol
ID	5671696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3936731
End bp	3938194
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	78%
IMG OID	641242213
Product	glycosyl transferase family protein
Protein accession	YP_001507633
Protein GI	158315125
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.624929
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACGC CCGTGGCCCC GCTGCCGGTC GGCTTCCGGG TCGTTCTCGA CATGTCGGCA 
CGGCGGCTGA GCGCCGACAG CTGGCTCGGC GGCTCGCCGG CCAGGGTGAT CCGGCTGACC 
GCGGCCGGCC AGGCCGCCTG GCAGGAGCTC GCGACCGGCC CGGTGGTGTC CCCGCGGGCA 
GGCGCCCTGG CCCGCCGGCT CACCGACGCC GGCCTGGCAC ATCCCAGGCC GCCCACGCCG 
CGGCACGACC CGGACATCAC CGTCGTGATC CCGGTCCACG ACCGCGTCGA CAAGCTGGCC 
CGGTGCCTCG CCGCAGTGGG CGACCGCCAC CCGGTCGTCC TGGTCGACGA CGGCTCGCGC 
GAGCCCGACG CGATCATCGA GCTCGCCGAC CGGTTCGGCG CGAAGGTGAT CAGGCGCCCC 
GTCAACGGCG GGCCGGCGGC GGCCCGCAAC ACCGGGCTGG CGGCGACCGC TGGCGAGCTC 
GTCGCCTTCG TGGACAGCGA CTGCGTGCCG CCGGCGGGCT GGATCGACGC GCTGGCCGCG 
CACTTCGCCG ACCCGCTGGT CGGCGCCGTG GCCCCGCGCA CGGTCCCCGC TCCCGGCACG 
CCGGGCGGCT GGGCCGGCCG GTACGCCGGC ACCACACGCA GCCTCGACCT CGGCGGCACG 
CCGGCCCGGG TCGGGTCGAA CACCCGGGTG GCCTACGTCC CGACCGCCGC GATCCTGGTC 
CGCCGCGCGG CGCTGGCCGA GATCGCCGGC GGCGGTCCGG CGGCCGGCGG GGCGTTCGAC 
ACCACGCTGT CGGTCGCGGG CGAGGACGTC GACCTGGTGT GGCGGCTGGA CAAGGCGGGC 
TGGCGCATCC GGTACGACCC GACCGTCGAG GTCCGGCACC TGGAACCGGA GACCTGGGCC 
GGGCTGCTCG GCCGGAGGTT CCGGTACGGC ACGTCCGCCG CGCCGCTGGC GCTGCGCCAC 
CCGGGATCGC TGCCCCCGCT CGTCCTGTTC CCGGGGCCGG CGCTGACGGT CGCCGCGCTG 
CTCGCCCGTC GGCCCGTGCT GGCCGCCGCC GCGTACACCT GTTCGGTACT GCGCACCGTG 
CGGACGCTGC GCCGGTCAGA CCTGCCCGTC CGGGAGGTGG CGCGCGCGAC GGCAGGTGCC 
GTCGGCCGGA CCTGGCTCGG CGTCAGCCGG TACGGCACCC AGTACGCCCT GCCGCTGCTC 
GCGGCCGGCG CCGCGGGTGG CGGCCGCCGG CGCTGGGGAC GTCGGGCGGC GGTGGCATCA 
CTGGTCGTCG GCCCGGCCCT GGCGGAGTGG GCGGGCCGGC GCGGGTCGAT GGACCCGGTG 
CGGTTCGTGC TCGGCCGTCT CGCCGAGGAC GTCGCCTACG GCAGCGGTGT GTGGACCGGG 
TGTGTGCACA ACCGGACGAC CATCCCGGTG CGCCCCACGA TTGGCCGGCG CGCCCACGGG 
TCGAGAGGAC CCGACCATAG ATGA

Protein sequence

MTTPVAPLPV GFRVVLDMSA RRLSADSWLG GSPARVIRLT AAGQAAWQEL ATGPVVSPRA 
GALARRLTDA GLAHPRPPTP RHDPDITVVI PVHDRVDKLA RCLAAVGDRH PVVLVDDGSR 
EPDAIIELAD RFGAKVIRRP VNGGPAAARN TGLAATAGEL VAFVDSDCVP PAGWIDALAA 
HFADPLVGAV APRTVPAPGT PGGWAGRYAG TTRSLDLGGT PARVGSNTRV AYVPTAAILV 
RRAALAEIAG GGPAAGGAFD TTLSVAGEDV DLVWRLDKAG WRIRYDPTVE VRHLEPETWA 
GLLGRRFRYG TSAAPLALRH PGSLPPLVLF PGPALTVAAL LARRPVLAAA AYTCSVLRTV 
RTLRRSDLPV REVARATAGA VGRTWLGVSR YGTQYALPLL AAGAAGGGRR RWGRRAAVAS 
LVVGPALAEW AGRRGSMDPV RFVLGRLAED VAYGSGVWTG CVHNRTTIPV RPTIGRRAHG 
SRGPDHR