Gene Francci3_2032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2032
Symbol
ID	3906749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2389395
End bp	2390633
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	73%
IMG OID	637879369
Product	hypothetical protein
Protein accession	YP_481135
Protein GI	86740735
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.570232
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCT CCGATCCGGA CGCGCTCGCC GCCGCGAACA CTGTTGCCGA AGCACTAGCC 
GACCCGCACA CCGCCTGGGC CGCCCACCGA CCGACCGGGG GAAGGGCGTG GCCGCAGTCG 
CTCGCCGGCG GCGCGGCGGG CATCGCCCTG CTGCACATCG AACGTGCCCG CTCCGGGTAC 
GGCGACTGGA GCACCGTGCA CGCCTGGCTG TCCGCCGCCG CGTCCGACGC CCTGACCGCG 
GCGGCCAACG CGGGCCTGTA CCTGGGCGCT CCGGCCCTGG CCTTCACCCT GCACACCGCA 
GCCGGACCAT CAGGCCGGTA CCACCGTGCC CTCGCCCATC TGGATCAGGC CGTCGTCGCC 
ATGACCCGCA CCCGACTCGC CGCGGCCCAC ACACGCATCG AACAGAGCCG GCGGCCCGCG 
ATGAAGGAGT TCGACCTGAT CCGGGGCCTG ACCGGACTCG GCGTCTACCA CCTGCGCCGC 
CACCCCGATC ACCCGATCAC CGGCGAACTG CTGTCGTACC TGGTCAGACT GACCGAACCA 
CTGGCCGGAA GAGACGACCT CCCACCCTGG TGGACGGACT CTGCACCCAA CGGCGAACCC 
AGCCCCGAAT TCCCCCAAGG ACACGGCAAC GTCGGCCTCG CGCACGGCAT CAGCGCCGTC 
CTCGCCCTGC TTGCCCTGGC CCACCTGCGC GGCCTGCCGG TCCGTGGCGC CGACGACGCG 
ATCGCACGGA TCTGCGCCTG GACCGACCGC TGGTGCCAGC ACGGCGACAC CGGCCCCTGG 
TGGCCCGGAT TCATCACCCT CCGCCAGGTC CGTGAAGGCA AGGTCGCCGC AACCCTGCGG 
CCCCGCCCCT CCTGGTGTTA CGGCGTCAGC GGCACCGCCC GCGCCCAACA GCTCGCCGGC 
ATGGCCCTGC GCGACACCGC ACGCCAGCAA GCCGCCGAGA ACGCGCTCCT CGCGGCACTT 
CGCGATGAGG CGCAACTCGA CCAGCTCACC GAGATCGGCC TGTGTCACGG CACCGCCGGG 
CTACTCCAGT CCGCCTGGCG CATGGCGGCC GACTCCCACC ATCCCCAGCT CACCGCCGAA 
CTCCCCGGCC TGTCAGCCAG GCTGATCGCA CAGATGGGCA CAACCGTGCG CGACCCCGAA 
CTTCTCGACG GCGCCGCCGG CGCCGCCCTC GCCCTGCACA CCGCCGGCAC CGGCGCCGCC 
CCGACGTCGG GCTGGGACGC CTTCCTCCTG CTGGCCTGA

Protein sequence

MTSSDPDALA AANTVAEALA DPHTAWAAHR PTGGRAWPQS LAGGAAGIAL LHIERARSGY 
GDWSTVHAWL SAAASDALTA AANAGLYLGA PALAFTLHTA AGPSGRYHRA LAHLDQAVVA 
MTRTRLAAAH TRIEQSRRPA MKEFDLIRGL TGLGVYHLRR HPDHPITGEL LSYLVRLTEP 
LAGRDDLPPW WTDSAPNGEP SPEFPQGHGN VGLAHGISAV LALLALAHLR GLPVRGADDA 
IARICAWTDR WCQHGDTGPW WPGFITLRQV REGKVAATLR PRPSWCYGVS GTARAQQLAG 
MALRDTARQQ AAENALLAAL RDEAQLDQLT EIGLCHGTAG LLQSAWRMAA DSHHPQLTAE 
LPGLSARLIA QMGTTVRDPE LLDGAAGAAL ALHTAGTGAA PTSGWDAFLL LA