Gene Francci3_1692 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1692
Symbol
ID	3903269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2029410
End bp	2030720
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	76%
IMG OID	637879030
Product	hypothetical protein
Protein accession	YP_480797
Protein GI	86740397
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000294566
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.174078
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCATC CCGTACGAAT TCCCGCCGAT GTTGATCGCG AAGATCGGAT CATGGCGGGC 
CTGACCGCCC GGCAGGTGTT GATCCTCGCG CTGACCGCGA TCGTGCTCTA CCTCGCCTGG 
GCCGCGACCC GTGCCCTGCT GCCGTTGCCG GTGTTCGCGC TGCTCGCCGT CCCGGTCGCC 
GCGGGCGCCG GCGTCCTCGT CCTGGGCCAG CGCGACGGGC TGTCCCTCGA CCGGATGCTC 
GTCGCCGCGA TCCGCCAACG CACCAGCCCA CGACACCGCA TCAACGCCCC CGAAGGAGTG 
ATTCCGCCGC CGTCCTGGCT GGCCGCCCGC GCCACGAGCA GCTCCGGTGA CCGACGGCCG 
GCCGCGGGCG GGCAGAGCGC GGCGCCGCTG CGGCTACCGG CCCGCACCGT CACCACCAAC 
GCCGGGGTCG GCGTGATCGA CCTCGGGCCG GACGGGCTTG CGGTCGTCGC GGTCGCGAGC 
ACGGTGAACT TCGCGCTGCG CACGCCGGGC GAGCAGGACG GGCTGGTCGC CGTGTTCGCC 
CGCTACCTGC ACTCCCTGAC CGCGCCGGTG CAGATCCTCG TGCGGGCCAT GCCCGCCGAC 
CTGACCGACC AGATCCGTCA ACTCGACGAC GCCGCCGACC AGCTGCCCCA CCCCGCGCTC 
GCGCACGCCG CCCGCGAACA CGCCACCTAC CTGGCCCAGC TCGCCGACGA GATGCAGCTG 
CTGACCCGCC AGGTCCTGCT GGTCCTGCGA GAGCCGCTCG TGGCGGCCGG CCCGGTCGAC 
GGGCTCGGGG GCGCATCCCC GCTGGCCGCA CTGTCCGGCC GACGGGCGGC GGCCCGCGAC 
GCCCGCCGCG CCGGAGCGGC CATCCGACGG GCCGCGCACA CCCGGCTCGC CCGCCGGCTC 
GCCGAGGCGA CCGACCTGCT GGCACCGGCC GGGATCGTGG TCACGCCGCT GGACGCGGGC 
ACGGCGACCA GCGTGCTGGC CGCTGCCTGC AACCCGGCCG GCCTGGTGCC GCCGGCCGCG 
CTCGCGGCCC CCGACGACGT CATCACCGCC GATGTCCCCG AGCCCGTCGA CAGCTACTCG 
GCCTACCAGC CCGACACCGA CGACGGCTTC CTGGACGACG CCGGGTTCGA CGACCCGGAC 
GCGGCGGTCG GAGCCGGCTA TGGCGACCGG TTCGACGACG CCGATGGGGA CGGCCCGCTC 
AACGACCCCG ACTTCTGGGA CCCGCCCGCC CTGCGCCCGC CGGCCGGGCG TTCCGACGGC 
GGCTCCCGAC GGCCAGCACG ACACACGGCG CGCAGGGGAC ACGCCCGATG A

Protein sequence

MTHPVRIPAD VDREDRIMAG LTARQVLILA LTAIVLYLAW AATRALLPLP VFALLAVPVA 
AGAGVLVLGQ RDGLSLDRML VAAIRQRTSP RHRINAPEGV IPPPSWLAAR ATSSSGDRRP 
AAGGQSAAPL RLPARTVTTN AGVGVIDLGP DGLAVVAVAS TVNFALRTPG EQDGLVAVFA 
RYLHSLTAPV QILVRAMPAD LTDQIRQLDD AADQLPHPAL AHAAREHATY LAQLADEMQL 
LTRQVLLVLR EPLVAAGPVD GLGGASPLAA LSGRRAAARD ARRAGAAIRR AAHTRLARRL 
AEATDLLAPA GIVVTPLDAG TATSVLAAAC NPAGLVPPAA LAAPDDVITA DVPEPVDSYS 
AYQPDTDDGF LDDAGFDDPD AAVGAGYGDR FDDADGDGPL NDPDFWDPPA LRPPAGRSDG 
GSRRPARHTA RRGHAR