Gene Francci3_1105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1105
Symbol
ID	3905776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1318991
End bp	1320430
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	70%
IMG OID	637878437
Product	hypothetical protein
Protein accession	YP_480214
Protein GI	86739814
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0363479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.305045
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAGTG TGCAGGACGA ACCAGGACGC GTCGAGGCTC TGGGACGGCT GTGTCGCTTC 
CGGCTGGAGT TCTACGACTG CCTGACCCGC CGAGCGGACG CGCTGTTCGA AACGGCGGAG 
GCGGTGCTGT GCACCGACGG CCCGGTCCGG ACGCTGGTCG ACCTGACACT GGCCCCGGAG 
CACCGTCGCG GCCATGGAGC CTTGTACGAC GGGCTGAACA GCGGCCGATT AGAGATCGCC 
CGGCTGCGAC GTGCGCTCGC GGACCTTCCG CTGCCCGCGG CCGCTGACGG ACGACTCGTG 
CTGGCCGTCG ATGTCAGCCC ATGGCTGCGC TCGGACGCCT CGACCAGCGC GGAGCGGCTG 
TTCTGCCATG TTCATGGTCG CGCGAAGAAC CAGTCCCAGC TGATTCCTGG CTGGCCGTAC 
TCGTTCGTCG CGGCCCTCGA GTCCGGCCGG ACGTCGTGGA CCGCGCTCTT GGACGCAGTT 
CGCCTCGGCC CCACCGACGA CGCCACAGCG GTGACCGCCG ACCAGCTCCG GGCGGTCGTG 
GGCCGGCTGA TCGCCGCCGG GCACTGGCAC GACGGAGACC CGAACATCCT GATCGTGATG 
GACGCCGGGT ACGACGTGAC CCGGCTGGCG TTCGTCCTGG CCGACCTGCC TGTCGAGGTG 
CTCGGCCGGA TCCGTTCCGA CCGTGTCCTG CGCCTGGCCA AACCACCGAG ACAGCCGGGT 
ACCAACGGCC GTCCGCCCAA GCACGGCCCC GAGTTCGCCC TCGACAGGCC CGCGACTTGG 
CCCGAACTGC AGCACACCAC GACCACCAAC ACCAGCCGCT ACGGCACCGC CACCGCGACC 
AGCTGGAACC GGCTACACCC CCGGCTCACC CACCGCACCT GCTGGCTCGA CCACCCCGGA 
GACCTACCGA TCATCGAAGG GACCCTCATC CGCCTGCAGG TCGACCACCT CCCCGGCGAC 
CGCGACCCCA GGCCCGTCTG GCTGTGGTCC TCCGCGGTTG ACGCCACCGC CACCGACATC 
GACCGCGCCT GGCAGGCGTT CCTGCGCAGG TTCGACCTGG AACACACCTT CCGACTGTTC 
AAACAGACCC TCGGCTGGAC CCGCCCGAAG ATCCGAACCC CGCAGGCCGC GGACCGCTGG 
ACCTGGCTGA TCATCACCGT CCACACCCAG CTCCGCCTCG CCCGACCCCT GGCCCGCGAC 
CTACGCCGCC CCTGGGAGAA ACCCGCCCCA CCAGGACGAC TCACGCCCGC CCGAGTCCGA 
CGAGGATTCC GGAACATCCG CGCGATCATG CCCCTCCCCG CCAGCGCACC GAAACCCACC 
AAGGCTGGCC CCGGCCGCCC TCCCGGCTCA CGCAACCGCA GACCCGCACC CCACCACGAC 
GTCGGAAAAA CCATCCGACG GGACCTCACC ATGACCGCCC ACCAACACCG CACAGGTTAA

Protein sequence

MGSVQDEPGR VEALGRLCRF RLEFYDCLTR RADALFETAE AVLCTDGPVR TLVDLTLAPE 
HRRGHGALYD GLNSGRLEIA RLRRALADLP LPAAADGRLV LAVDVSPWLR SDASTSAERL 
FCHVHGRAKN QSQLIPGWPY SFVAALESGR TSWTALLDAV RLGPTDDATA VTADQLRAVV 
GRLIAAGHWH DGDPNILIVM DAGYDVTRLA FVLADLPVEV LGRIRSDRVL RLAKPPRQPG 
TNGRPPKHGP EFALDRPATW PELQHTTTTN TSRYGTATAT SWNRLHPRLT HRTCWLDHPG 
DLPIIEGTLI RLQVDHLPGD RDPRPVWLWS SAVDATATDI DRAWQAFLRR FDLEHTFRLF 
KQTLGWTRPK IRTPQAADRW TWLIITVHTQ LRLARPLARD LRRPWEKPAP PGRLTPARVR 
RGFRNIRAIM PLPASAPKPT KAGPGRPPGS RNRRPAPHHD VGKTIRRDLT MTAHQHRTG