Gene Franean1_6552 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6552
Symbol
ID	5674867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7968528
End bp	7969730
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	71%
IMG OID	641245401
Product	hypothetical protein
Protein accession	YP_001510795
Protein GI	158318287
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.413404
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCA CGGCGGAAGA CCCGGTGGCG GCGTCCCAGG ACGTGGTGCT CACCCTGTTC 
AGAGAAACGC TCCAGGATAT GGCGATCAGG GCGTATATGC GTCCACCCGA CCGCCTGCTC 
ATCACCCTGC TGCGCTCGTC ACGGGTGAGC CGGGTCCTGG TGGCGGAGCC GTTCCGCAGC 
CTGCTCGGCA CGATGGTTCG GGGTGGGCGG ATGGTCGCCC TGCCGCCGGC CAGCGGACCC 
GAGCGGTACC TGGTGTCGCC GCAGCGGTGG CGACGGGACG ATCCGGCGTC GCTGCCGCTG 
GTGCGCAGCA CCTACCGTCG CTACGACGCC GCGCTGCGCC GGCGCGTGGC CCAGGCCAGC 
TGTGAGCGGC CCGTCCTGAT TACCACGAAC CCCCTGGTGG CGGGCTTTGC CGAAGCGGAA 
TGGGCGAACT CGGTCGTGTA TTTCGCGCGG GACGACTGGG CGTCGTCCCC GCCGCTGCGG 
CGGTGGCATC CGGCATTCCG CCGGGCCTAT GTGGAGATCC GCCGACGCCG ACGGCCGGTC 
ATCGCGGTCT CCCGGCCGCT CCTGGAGCGC ATAGACCCGA CCGGCGAGGG CCTGGTCGTC 
CACAACGCCG TCGATCCGGC TGAATGGCGG CGTCCACCGG CCCCGCCGGA GTGGCTTCAG 
CGGCTCCCGC GGCCGTGGTG TGTATATGCC GGCAGCGTCG ACGACCGCCT CGATCTGGAC 
CTGGTTCGAC GCCTGGCCTC GGCCGGCACT GTGGTTCTGG CCGGCCCGGT CGAGCGCGAG 
GAACACGTCA GACCGCTGCG GTCGGTTCCC TCGGTGCACC TGCCGGGCCA TCTGCCGCGG 
CCGGTTGTCA CGGGAGTGAT CGCTGCGGCC GACGTGTGTC TGCTCACGCA CCGACGCACC 
CCGCTCACCG AGGCAATGGA CCCTATCAAG ATCTACGAAT ACCTCGCGGC CGGCTGTCCT 
GTGATCGCCA CGGACCTCAC CCCCGTCCGT GACATCAGCC CGCGGGTCCG GCGGCTGGGG 
CCCGGGGAGG ATCCGGTGTC CGTGCTGCGC GAGGTTCTTG CCTGGCCCGC AGTTGACGAG 
GCCGAGCGGC TGGCCTTTGT CGACCGCAAC AGCTGGGCAT CCCGGCATGT CAGCCTGCTC 
CACTTTGCCC TCGGCGGGTC CTCGTCTCCC GTACCGGCCG GCCCCCTGCC GCTACACGCC 
TGA

Protein sequence

MTVTAEDPVA ASQDVVLTLF RETLQDMAIR AYMRPPDRLL ITLLRSSRVS RVLVAEPFRS 
LLGTMVRGGR MVALPPASGP ERYLVSPQRW RRDDPASLPL VRSTYRRYDA ALRRRVAQAS 
CERPVLITTN PLVAGFAEAE WANSVVYFAR DDWASSPPLR RWHPAFRRAY VEIRRRRRPV 
IAVSRPLLER IDPTGEGLVV HNAVDPAEWR RPPAPPEWLQ RLPRPWCVYA GSVDDRLDLD 
LVRRLASAGT VVLAGPVERE EHVRPLRSVP SVHLPGHLPR PVVTGVIAAA DVCLLTHRRT 
PLTEAMDPIK IYEYLAAGCP VIATDLTPVR DISPRVRRLG PGEDPVSVLR EVLAWPAVDE 
AERLAFVDRN SWASRHVSLL HFALGGSSSP VPAGPLPLHA