Gene Franean1_0383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0383
Symbol
ID	5668807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	459444
End bp	460775
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	72%
IMG OID	641239315
Product	glycosyl transferase family protein
Protein accession	YP_001504755
Protein GI	158312247
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.138846
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0930893
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACCTGC TCGACGCCGA CGGCCGCGAC GCGCGCCTGC TCGCCGCGGC CATGATCACC 
TTCGGGATGG TCTACCTGTT CGCGATGCTG GTGCTCTCCC GTGTCCACCG ACCCCGGACG 
GGCACGCCCC CCGACGGCCT CTTCTTCGTC TTCGTGATGC CCTGCCTCAA CGAGGAGGCG 
GTCATCGAGG CGAGCCTGCG CCGGCTCCTG CTCTCCCCCG CCACGAACCG CCGGGCCCTC 
GTCGTCGACG ACGGCTCGGA CGACCGGACC TCGCTGATCG TCCGCGGGGT GGCCGACGAC 
CGGGTGTGGC TGCTGCGCCG CGAGCCACCG GACGCCCGAC GGGGCAAGGG TGCCGCGCTG 
AACGCCGCCG TGGCCCATCT GGCGACCCGC CCGGAGATCG CCGCCCGCGA CCCCGACGAC 
GTGATCATCG CCGTGGTCGA CGCGGATGGC CGTCTCGACC CGCACTCGGT GGAGGCGGTC 
GCCCCCTACT TCGCCGATCC CCGCACCGCC GGCGTGCAGA CGGGCGTGCG CATCAACAAC 
CGGCACACCA GCCTGCTCGC CCGGCTCCAG GACATGGAGT TCGTGATCTA CACCGATGTC 
TTCCAGCGCG GACGCGGCCA ACTGGACAAT GTCGGCCTCG GTGGCAACGG CCAGTTCGTC 
CGGCTCTCGG CGCTGCGGTC CCTCGGCGGC GACCCGTGGT CGCACAGCCT GACCGAGGAT 
CTCGATCTCG GTGTCCGGCT GCTGCTGACG GGCTGGCGCA ACCAGTTCTG CCCGCAGGCG 
GACGTCCACC AGCAGGGGGT CGTCCGGCTG GGACGGCTGC TGCGGCAGCG GTCGCGCTGG 
TTCCAGGGCC ACCTGCAGTC GTGGGCGCTG ATGCCCCGCG TGCTGCGGCA GGCGCGGGCC 
CGGGCGCTGC CCGACATGCT GTTTCACCTC TCCAGCCCGC TGCTGATCCT CCTCGCGTCG 
CTGCTGACGG CCGCCTTCGT GCTCAGCACG GTGGGCGTGC TGACGAGCTG GCTCGCCGGC 
GGGCCGGCGC CGGACCCGCG CTACTTCCTC GGCGCCTACC TGATGGCGGC GGGACCGGCG 
CTGGTCTGCG CGCTGATCTA CCGGTCACGC GAGCCGCTTG TTGGCTTCGG CGTGGTCCGC 
CTAGCCGGCT ATGCGCACCT CTACATGCTG TACGCGCTGG TGTGGTTCGT CGCCGGCTGG 
TGGGCGATGG GACGGGTGGT CAGCGGCCGG ACGAGCTGGC ACAAGACCGC CCGAACCCCG 
GAGAGCGCGC CACCCACGCC CCTCCAGCCA GTGTCCGCCG CTCCCGCCGC TCCCGAGGGA 
CCGGACCGGT GA

Protein sequence

MNLLDADGRD ARLLAAAMIT FGMVYLFAML VLSRVHRPRT GTPPDGLFFV FVMPCLNEEA 
VIEASLRRLL LSPATNRRAL VVDDGSDDRT SLIVRGVADD RVWLLRREPP DARRGKGAAL 
NAAVAHLATR PEIAARDPDD VIIAVVDADG RLDPHSVEAV APYFADPRTA GVQTGVRINN 
RHTSLLARLQ DMEFVIYTDV FQRGRGQLDN VGLGGNGQFV RLSALRSLGG DPWSHSLTED 
LDLGVRLLLT GWRNQFCPQA DVHQQGVVRL GRLLRQRSRW FQGHLQSWAL MPRVLRQARA 
RALPDMLFHL SSPLLILLAS LLTAAFVLST VGVLTSWLAG GPAPDPRYFL GAYLMAAGPA 
LVCALIYRSR EPLVGFGVVR LAGYAHLYML YALVWFVAGW WAMGRVVSGR TSWHKTARTP 
ESAPPTPLQP VSAAPAAPEG PDR