Gene Francci3_3252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3252
Symbol
ID	3904423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3850784
End bp	3852388
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	73%
IMG OID	637880577
Product	hypothetical protein
Protein accession	YP_482338
Protein GI	86741938
COG category	[S] Function unknown
COG ID	[COG2187] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGACC CGAGCATGCT GCCGCGGCCG CCGGGACGCG GGCAGGCTCG TGCCATGAGT 
CTGGAGACCA CGGTGAACCC GCTCCCGGCG GAGCGAGGCG CCTCGGCCTC GGCGCCAGCG 
GTGGCGCCGA CGGTGGCGTC GGGGCCTCCT GCCAGGGTCG TCGAGACGGC GCGGTCCGTG 
CTCGTCTTCC TTGGAGATCG TGTCTTCAAG GTCAAGAAGC CGGTCGACCT CGGTGCCGTG 
GATTTCCGCG GCAGGCAGGC GCGGTTGGCC GCCTGCGAGG CCGAGGTGAG ACTCAATCGT 
CGCCTCGCGC CCGACGTCTA CCTCGGCGTC GCCGATGTCA TCGGACCGGA CGGGGAGCCC 
TGCGACCACA TGGTCGTGAT GCGGCGACTA CCCGAGGCGC GCCGGCTGTC GACGCTTGCC 
GAAGGTGGCA CCGAGGTCAG GGCGGAGATC CACGCCCTCA CCCGGGTGCT GGTCGACTTC 
CACGCCCGGT GTGAGACCTC GTCCCGGATC GCCGAGGCAG GTGGCCTGGA CCGTCTGCGT 
GGGCGGTGGG ACGCCTGCTT CGCCCGGGTA CAGCGTGACC ATGGCGCGGC GGTGAGCGCC 
AGCATCCTCG ACCATGTGAA CCGTCTCGCC GTGCGGTACC TCGACGGCCG CGACGAGCTC 
CTGCGGGAGC GGCGCGAGGC CGGGCGGATC CGCGACGGGC ACGGCGATCT GTCCGCCGCG 
GACATCTTCT GCCTCGACGA CGGGCCCAGG GTGCTCGACT GCCTGGAGTT CGAACCCGGG 
CTGCGGGCGG CCGACGTCCT CGCGGACGCC TGCGCCCTGG CAGCCGACCT CGAGTGGCTC 
GGACGCCGCG ATCTCGCCCG GCTCTTCCTC GATCACTACC GTGAGATGGC TGGTGAGACC 
CATCCTCGGT CGCTCGAGGA TTTCTACTGG GCGCTGGCCG CGCTGGGGCG CTGCCAGGCG 
GCGTGCCAGC GTGTCGCGGC CGGCGAGAAC GCGGCGGCGG AGGCGCGGGC CTTCGCTGAC 
CTGGCACTGG CCCGGTTGCG CTGGGGCCGG GTCCGACTCG TGCTGGTCGG CGGCCAGCGC 
GGCACCGGGA AGTCCACGCT CGCCGGCGGG CTCGCCGGCA CGGAGCGGTG GACCGTGCTC 
CGCTTCGACG ACGCCGCGGC GGACCTGGCG GCCTCGGCCA ACCGTCACGA TCTCGCGGCG 
GGGGGATGGG CAGATGCAGG GGGATGGGTA CCGGCCGACG ACGTCGACGC GGTCCACCAG 
GAACTGCTGC GCCAGGCCGG CACAGCGCTG CGCCGCGGCG AGTCCGTCGT GGTCGACGCA 
CCGTGGAACC GGCACAGCCA GCGCGCGCAA GCGGCCGATG TCGCTCGCCG TGCCTTCGCG 
GACCTGGTGC AACTGCGCTG CACGGCCCCG CCCGATCTCG CGGCAACCCG TACCGACCGG 
CGTTCCCCGG CAACCACCGC GGCAACCAGC GCCACAGGGT CCGTCGGCCT TGGCCGTCTC 
GCCGACACCG TCTCCCGGAT CGAACCCTGG CCGGAAGCCA AGATCATCGA TACGGCGGTG 
GCCATCGCCG AGTCGCTGCA CAACGCCCGC CGCGCCGCGG CCTGA

Protein sequence

MHDPSMLPRP PGRGQARAMS LETTVNPLPA ERGASASAPA VAPTVASGPP ARVVETARSV 
LVFLGDRVFK VKKPVDLGAV DFRGRQARLA ACEAEVRLNR RLAPDVYLGV ADVIGPDGEP 
CDHMVVMRRL PEARRLSTLA EGGTEVRAEI HALTRVLVDF HARCETSSRI AEAGGLDRLR 
GRWDACFARV QRDHGAAVSA SILDHVNRLA VRYLDGRDEL LRERREAGRI RDGHGDLSAA 
DIFCLDDGPR VLDCLEFEPG LRAADVLADA CALAADLEWL GRRDLARLFL DHYREMAGET 
HPRSLEDFYW ALAALGRCQA ACQRVAAGEN AAAEARAFAD LALARLRWGR VRLVLVGGQR 
GTGKSTLAGG LAGTERWTVL RFDDAAADLA ASANRHDLAA GGWADAGGWV PADDVDAVHQ 
ELLRQAGTAL RRGESVVVDA PWNRHSQRAQ AADVARRAFA DLVQLRCTAP PDLAATRTDR 
RSPATTAATS ATGSVGLGRL ADTVSRIEPW PEAKIIDTAV AIAESLHNAR RAAA