Gene Francci3_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2023
Symbol
ID	3906739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2378246
End bp	2379649
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	73%
IMG OID	637879359
Product	hypothetical protein
Protein accession	YP_481126
Protein GI	86740726
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.898641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCAGCC GGAACCGGGA ACGACGCAAG GCAAAACAGA AGGCCCGCGC GAACCGTGTC 
CGCGCCCAGG CGCCGGAGTC CGGGGCAGGG GCCTTCTACC AGGAGGAGCG CGGCCAGCGG 
GAGATGTTTC GCCGGATCGC CGATCAGCTG GTCGCGGCGG CGCTGAACGC CCAGCTCGCC 
CGGGATGAGG CGGCACTGGC CGAGTACGTG GAGTTGCTCG TCGCCGCGCC GGGCGGGCCG 
GCCGGACGCC GAGTTGTCAA TCGGTCCCTG GCCGGGTGGT TCGACCGCAC CGTCGAGGCC 
GCCTGGCAGC GCGGCTGGCA GCCGGCTGAC GTGCACCGGA TCGTGAACCG TCAGGCAGGC 
CAGCGCCAGG CGCGACTCGC CGTCGACGCC ATCGCCGGCC AGATGCGGCA ATACGCGGCC 
GCCACCGTCG ACGAGCGGTG GAAGAACCAG CTGTATGATC TTAACGCCGT TCTGTGGTGG 
GAGGATGACG GCACCTGGCT GGACGCCTGG GGTGACCGGG AGGGCCGGGA CCGGGCGGAG 
GCGCTTGCCG ACACCCTTGG TCTGCTCACC CTTCTGCACA CCCTTCCCGC GATCGAATCC 
CTGTGCCCCC CGCCAGGCAC CACACGACGC GACCCACCAG GTCGCCCCGC GGGACGCGGC 
CACGGCCAGG CGGACCCGGG CCACCGGGCC GGGGCCGGCC GGAGCGCCGA CCCACGCATC 
CTCGACAAGG TCCGGGCGCT GCTGGCGAAG GCCGAATCAA CCGGGTTCGC GGACGAGGCT 
GAGGCGCTGA CCGCCAAGGC ACAGCAGCTC ATGGCCCGGC ACAGCATCGA CGAGGCGCTG 
CTCGCGGCGC GGGAGGGAAC CCGCGACGAG CCGGCCGGCC GCCGGGTCGG CGTCGACAGC 
CCTTACGAGG CGGCCAAGGC CAGCCTGCTC GACGTGGTCG CCGGTGCAAA CCGATGCCGT 
TCGGTGTGGA CAAAGAACCT CGGGTTCGCC ACGGTGATCG GTTTCCAGCC TGACCTCGAC 
GCCGTCGAAC TGCTGTACAC CTCGCTCCTG GTCCAGGCGA CCGCGGCGAT GATGCAGGCC 
GGGTCCCGCC ACGGGCGGTC CCGCACCCGG TCGTTCCGCC AGTCGTTCCT CGCCTCGTTC 
GCGGTCCGGA TCGGCCAACG CCTGACGGCC GCTACCGAGC AGGCCAGTGA ACAGGCCGCG 
GTCGAGGCGG GCGAGAGCCG GCTGCTGCCT GTGCTCGCCG CCCGTGGCGA CGCCGTGAAG 
GAGGCAGCCG AGACGATGTT CCCGCAGGTC GTCGCCCGGG CGGTGAACGC GACCGACGGC 
GAGGGGTGGG CGTCCGGCCG GGCCGCCGCT GACCTCGCCT CCCTGCACAC CTACGGCGAG 
GTGACCACCG CCCGGTCCCG ATAG

Protein sequence

MGSRNRERRK AKQKARANRV RAQAPESGAG AFYQEERGQR EMFRRIADQL VAAALNAQLA 
RDEAALAEYV ELLVAAPGGP AGRRVVNRSL AGWFDRTVEA AWQRGWQPAD VHRIVNRQAG 
QRQARLAVDA IAGQMRQYAA ATVDERWKNQ LYDLNAVLWW EDDGTWLDAW GDREGRDRAE 
ALADTLGLLT LLHTLPAIES LCPPPGTTRR DPPGRPAGRG HGQADPGHRA GAGRSADPRI 
LDKVRALLAK AESTGFADEA EALTAKAQQL MARHSIDEAL LAAREGTRDE PAGRRVGVDS 
PYEAAKASLL DVVAGANRCR SVWTKNLGFA TVIGFQPDLD AVELLYTSLL VQATAAMMQA 
GSRHGRSRTR SFRQSFLASF AVRIGQRLTA ATEQASEQAA VEAGESRLLP VLAARGDAVK 
EAAETMFPQV VARAVNATDG EGWASGRAAA DLASLHTYGE VTTARSR