Gene Francci3_1571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1571
Symbol
ID	3904803
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1885120
End bp	1886310
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	72%
IMG OID	637878908
Product	hypothetical protein
Protein accession	YP_480676
Protein GI	86740276
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.443604
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGACG CCCCCACGGC GGATCAGCGG GACGTGGTGC TGGCCCTGCC GATCGAGACG 
CTCCAGGACA TGGCGATCAG GGCGTACATG CGTCCTCCCG ATCGTCTCCT GCTAACCCTG 
CTGCGATCGC CCCGGGTCCG GCGCGTGGTG GTGGCCGAGC CGTTCCGGAG CCATCTCGGT 
ACGGTGCTGC GGGGCGGCCG GAGCACCGTC CTGCCACCGT CCGGTGGCGT TGAGGGGCAT 
CTGGTGTCGC CGCAGCGGTG GCGCCGCAAG GACCCGGTGA CGCTGCCGTC GCTGCGGGCG 
GCCTATCGGC GGTATGACAG GAGGCTCGGC CGGGCCGCGG CCCGAGCCGG CTGTAAACGA 
CCCGTCGTGA TCACCATGTA TCCGCCGCTG GCGGGCTTTG CCGACATGTC CTGGGCCGGC 
TCGGTCATGT ACTACGCCCG GGACGACTGG GCGACCTACC CACCGCTACG GCGGTGGCAT 
CCGGCCTTCC GGCATGCCTA CGAGGAGATC CGGCGCCGGC GGCTGCCGGT CATCGCGGTG 
TCCAGGCCGC TGCTGGAACG CCTCCATCCC ACCGGTGCCG GGCTGGTCGT GCACAACGGT 
GTCGATCCGG CCGAGTGGCT GCGCCCGCCG TCCCCGCCGG ACTGGCTCCG GCGCCTCCCG 
CGGCCGTGGT GCGTGTATGC GGGCACCGTC GACACTCGCC TCGATCTGGA CATGATTCGC 
CGCCTGGCGT CGGCCGGCAC CGTGATTCTG GCCGGCCCCA TCCCGGACGA GGCCTCCGTC 
CGGTCGCTGC GGTTGCTGCG GTCGGTGCGG TTGCCTGGGC ATCTGCCCCG GCCGGCCGTG 
ACCGGTCTGA TCGCCGCGGC CGACGTGTGC CTGCTCACCC ACCGGAGCAC TCCGTTGACC 
GAGGCCATGG ACCCCATCAA GATCTACGAA TATCTGGCGG CCGGGCGTCC CGTCCTCGCC 
ACGGACCTCG CCCCGGTTCG GGGCATCGGG CGGCGGGTCC GGCTGCTGCG CCCGGGGGAC 
GATCCGGTGG CGGCGATGAA CGAGGTCCTG ATCTGGCCGG CCGTCACGGA GGCTGACCGG 
CTGGATTTCG TCGCGGACAA CAGCTGGTCC GCTCGGCACG TCGCCTTCCT GGACTTCGTC 
CTTGGCCCGG CCGCGCCGGC CGAATCCCGT CTTCTGGCGG TGCAGGCGTA G

Protein sequence

MKDAPTADQR DVVLALPIET LQDMAIRAYM RPPDRLLLTL LRSPRVRRVV VAEPFRSHLG 
TVLRGGRSTV LPPSGGVEGH LVSPQRWRRK DPVTLPSLRA AYRRYDRRLG RAAARAGCKR 
PVVITMYPPL AGFADMSWAG SVMYYARDDW ATYPPLRRWH PAFRHAYEEI RRRRLPVIAV 
SRPLLERLHP TGAGLVVHNG VDPAEWLRPP SPPDWLRRLP RPWCVYAGTV DTRLDLDMIR 
RLASAGTVIL AGPIPDEASV RSLRLLRSVR LPGHLPRPAV TGLIAAADVC LLTHRSTPLT 
EAMDPIKIYE YLAAGRPVLA TDLAPVRGIG RRVRLLRPGD DPVAAMNEVL IWPAVTEADR 
LDFVADNSWS ARHVAFLDFV LGPAAPAESR LLAVQA