Gene Francci3_3050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3050
Symbol
ID	3904250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3616307
End bp	3617620
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	68%
IMG OID	637880370
Product	hypothetical protein
Protein accession	YP_482136
Protein GI	86741736
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACGCTG ATGGGGTCGA GGCACTGAAG GCGCAGTTGG CCGAACGGTT CTGCCAGCTC 
CAGGCCGAGA AGGGCCTTAC AGGCACTGAG CTGGAGAAAC GCACCACCCA CAACCGGAAG 
AACGCCTCCG CCATCCGCAA CCGCGGCCGG CTCCCGACCC GCGACATCCT CCAGGCGTAC 
GACCAGGTGT TCGGCACCCG CAGCGAGCTA ACCGACCTCG GTGAACGAAT CCGCGCGGCG 
CAGAAGGCGG TACGGCTGAC CGAGTTGACC GCCGCGGCGG GGGTAGATAT CCCCGAGCCG 
CAGGCCGCAG AGTCGGAAGG GGAGGTGAGG GGGACGGACA GGCGAACGTT CTTCGAGCTC 
ACCGCGGCCC TTGCAGCCGA CACCTATCGG CGGCGCGCGC GGCTCGGTCC TGATGCGCTG 
ACCCTCGCCA GCCTTGATGG GGCGGTGGAC CGTCACGCAG CCGCCTTCAC GAGCACGCCT 
CACGACGCGC TCGCGCCCGA GGTGTTCAGG ACCTGGCAGT CTGCGGAGAA GCACATCGAA 
TCCGGGGTCA AGCCACGCGC ACACGCGAAG TTGACCCGTG TGGCTGGGTT GTCCGCTTAC 
ATGCTCGCCC GGCTTGCCTT CAACATGGGC GACCAGGACG CATCCCAGCA ACTCGTGATC 
CAAGCCCGGG ACCACGCCGA ACAGATCGAT GACGATGTGC TGACGGCGTC TGTTGCCGCG 
ATGGACTCCA CTCTGTGCTT CTACAGGCAG CAGTACGACG AGGCGGCGAA GATCGTCCGT 
AAGGCTGGGG CAGTCGCGGA TCACCCCTAC ACCCGGGCCC GCCTGTTCGC CTACGAGGCC 
CGCGCCTACG CCGCGTTCGG CGACCCGACG GCCACGCGGG AGGCGCTCGC ACGCATGAAT 
GCGGCCGTCA TCGAGACACA ACCACGGCCG GGGAGTTCCC CGTTCGGCCG AGCGAACGCC 
GACTGGTTCA CCGCCGGGCT GCTCGCCCGG CTGGGTGCTG GTACGGAGGC CGAGCCGCTC 
GCGCGTCAGG CTGTCGAGGC GTTCGATAGC GGCCGGGCCA CAGGCTTCGA GGACCACGGC 
CATGCCCTTA TGGTCCTGGC GACTACTCTG CTTCGCCGTG AGCGTCCGGA CCCGGCGGAA 
GCCGCGATGC TTGGCAGCCG CGCATTGGAG CTGGTAGCGG ACCGGCCTAC GCACACCGTC 
GTTACGCGCG CCTGCCGCCT CGTCAACGAT CTCTCCGGGT ACGGCTCGGT GCCGGAGGTG 
ACCTCTTTCC GGGAACAGCT CACTACCGCC CCGCGTCCCG CTTTGATGGG CTGA

Protein sequence

MHADGVEALK AQLAERFCQL QAEKGLTGTE LEKRTTHNRK NASAIRNRGR LPTRDILQAY 
DQVFGTRSEL TDLGERIRAA QKAVRLTELT AAAGVDIPEP QAAESEGEVR GTDRRTFFEL 
TAALAADTYR RRARLGPDAL TLASLDGAVD RHAAAFTSTP HDALAPEVFR TWQSAEKHIE 
SGVKPRAHAK LTRVAGLSAY MLARLAFNMG DQDASQQLVI QARDHAEQID DDVLTASVAA 
MDSTLCFYRQ QYDEAAKIVR KAGAVADHPY TRARLFAYEA RAYAAFGDPT ATREALARMN 
AAVIETQPRP GSSPFGRANA DWFTAGLLAR LGAGTEAEPL ARQAVEAFDS GRATGFEDHG 
HALMVLATTL LRRERPDPAE AAMLGSRALE LVADRPTHTV VTRACRLVND LSGYGSVPEV 
TSFREQLTTA PRPALMG