Gene Francci3_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1130
Symbol
ID	3906609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1346663
End bp	1347994
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	71%
IMG OID	637878461
Product	hypothetical protein
Protein accession	YP_480238
Protein GI	86739838
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.823409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.981294
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCACCCAC CTGCGAAGGC GTCGACGGGG AGGCCGAAGG TGCAAGCTGG TCAGCGAAAC 
GACGCACTCG CCAACCTGGC CGATCTGCTG CGGACACTGC GTGATCAGCA TCGGACCAAC 
AACAGCCGGC TCGAAGCCCG CACCGGCTTC AAACGCCAGC AGATCTCTCG GGCCGTCAAC 
GGCCAGGAGA TCCCGTCCGC GGACCTCGCG GACGCGCTGG ACACGGCGTT GGCCGCAGCG 
GGAGCCATCC GGCGATTGCG GGACGAAGCT GTCAGGGAGA AGCGGGCCCG GGACCTGGGG 
CTCGACCCGA GCAGGCAGGA GGAACCCGTG GACGCCAACC GTCGGCAGGC GTTCGAACTC 
GCCGCCGCGA GCCTCGTCGC CGCCCAGATG TACCGGGAGT GGACCTCGTC CGCCCCCGAT 
GTGCTGACCC TCGACGAGAT CGACGACGCG ATCAACGCGC ACACCGTCGC GTTCACCGTC 
GAACCGCACC AGCGGCTCGC GCCGAAGGTG TGGAAGACGT GGAAGTCGGC GCACCACCAC 
CTGATGAACG GCAGTGGCCG GGCCCGCCCG CAGACCAGGC TCACCGTCGC CGCCGGCTAC 
GCCTCCTACA TGCTGTCGCG GCTGTCGTTC AACCTCGGAG ACACCCTGGC TTCGCGCCGG 
TTCATCCGCC TCGCCGAAGA CCACGCGAGC CAGACCGACG ACGTGGTGCT GACCGCGTCG 
GTCGGGGAGA TGGTGACGAC GCTGGCGTTC TACGGCCGCC GCTACCAGGA AGCCGCCGTC 
TCGGCTCGGA AGACCGCGGT CGTGGCGGAC AACCCGTACA CCCGGGCCCG GATCGCCAGC 
TACGAGGCGC GGGCCCTTGG CGCGCTCGGC GACGTCGAGG GCACCCGGGC GGCGTTGAAC 
CGGATGCGCA CGTCGGTCAC GGACCTGCCG CTGCAGCCCG GGATCAGCCC GTTCGGCCCG 
GCCGCCGCCG AGATGATGTA CGCCGGGGTC CTGACCCGGA TCGGCGGTGG CGTCGAGGCC 
GAGCCGATAG CCCGAGCCGC GCTCGCCGCC TACGAAGGAG GCCAGGCGGG CGGGTTCGAG 
GACTACGGCC ACGCGCTGCT CGCGCTCGCG GCCAGCCTCA CCGCCCGCGA ACAGCCCGAG 
ATCGACGAAG CCGCGACCAT GGCCGGGAAG GTCGTCGACA TGCTCGACAC CCGGCCCACC 
GCCTCGGTCT CCGACCGGGT CGCAGAGATC GCCATAGCGT TCACCGGCCA CCCCACCGTC 
GAACCCGTCC GTGACTTCTG GGACCGCTGG CAGGCACGCC CCCGCCTCGA ACTGACCACG 
GGCCAGGCGT GA

Protein sequence

MHPPAKASTG RPKVQAGQRN DALANLADLL RTLRDQHRTN NSRLEARTGF KRQQISRAVN 
GQEIPSADLA DALDTALAAA GAIRRLRDEA VREKRARDLG LDPSRQEEPV DANRRQAFEL 
AAASLVAAQM YREWTSSAPD VLTLDEIDDA INAHTVAFTV EPHQRLAPKV WKTWKSAHHH 
LMNGSGRARP QTRLTVAAGY ASYMLSRLSF NLGDTLASRR FIRLAEDHAS QTDDVVLTAS 
VGEMVTTLAF YGRRYQEAAV SARKTAVVAD NPYTRARIAS YEARALGALG DVEGTRAALN 
RMRTSVTDLP LQPGISPFGP AAAEMMYAGV LTRIGGGVEA EPIARAALAA YEGGQAGGFE 
DYGHALLALA ASLTAREQPE IDEAATMAGK VVDMLDTRPT ASVSDRVAEI AIAFTGHPTV 
EPVRDFWDRW QARPRLELTT GQA