Gene Francci3_0123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0123
Symbol
ID	3903453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	153065
End bp	154531
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	65%
IMG OID	637877456
Product	hypothetical protein
Protein accession	YP_479246
Protein GI	86738846
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCCG ACAGCGGCAG GCCCAGCGCG AGCGGCGCAC GCGTCACCGG CGATGACCTC 
CAGTACGCAG TCGCCTGGCA CGCCGCGCTG CGCACCCTTG TGCCACACTC GGGCGCCAAC 
GCCGTCACTG TCGAGGCGGT GACGGCCGGC AACGTGGACG ACGTCGTCAT CGGGAAGGCC 
CACGGGCCGG ACGACTACAT GCAGGTCAAG GCCAGCGTCA CAGCCGAGAA AGCAGCGACC 
ATTGAGTGGC TGACCGCGCT GTCGGGCAAG CGAGGCCCCA GCATTCTCCA GCGGTTCTAC 
CGCACCTCGC AGCAGCTGCG GGTCGACGGT GCCCACCCGA GGCTGACCCT GGTCACGAAT 
CGGTCCATCC ACCCCGACGA CCCGGTGCTC ACCCTGCGAG ACCGCAATGA TCACTTGGCG 
GATCGGCTGT GCACCGCGAC TAATGCAGCT ACAGCGGCCG GACGTCGAAA CCTACTCCGT 
CACCTCGACT GCACCGACGA CGAGCTGTAC GAATTCCTGT CCAACCTGCG GCTACACACC 
GACGCATCCG AAGCTGCCTG GCGCGACTAT CATATCCGAG ACATAAGCCA CGCGGCGGGT 
GTCCAAGCAG ACGAAGTCGC CTACCGGCTC GGAATCGCCG AAGTTCGAGA GTGGGTCAAA 
ACCAGCCGCA GCCAGAAACG ACCAGCCGAC ATCGCGGCCG CCATCGACCG CCTCGGCATC 
CGGGCGCAAG AGCCATTCAC CATGGTTGCC ATCAACGCCC TCGACGAAGG CTTCACAAAC 
CCGGACGCCC GCGTGACGCT CGACTGGGTG GACCGATTCC GAGGAAGCGA GGCCCGCAGC 
CGACGCGGTC TCAAGAACCC CAAGGAATGG GAAACAGTTC TTCGGCCACA ACTCATCGAC 
GCTCAGCGGA CGTTGCGCAG CCTCGGCGCG AAACGCATCC TCATCACCGG CACCATGCGA 
CTGCCGACCT GGTTCACCGC TGCCGTCATG TTCCAGGAGA CAGCCGGATT TATCCCCGCC 
AAGACCAAGG ACGGCCAACT GTGGCTCAAA CCCGGCGGAA CGATCATGCC CGCTTCCATC 
TGCCTCTCGT CATCGATCGC TGAACTTCGG CCAGGCAGCG AGGTCGCACT CGCGCTCGCG 
ATCTCCGCCG ACCTGACCCC AGACGTCACC AGCTACATCG CTAGCACTGG ACGCGATATA 
CCCATCATCA CGATCAGCCT GCCCTCCGGA ATCTCGGGTA GTAGCATCGC CGACAGAGAT 
CACGCATATG CCGTCGCGTT GGCCGTTCGC GACCTGAGCC GGCAGATCGC GCGCCGTGTC 
AATCCGCCAA TACTCCACCT CTTCATGGCG GCGCCATCCG GCTTTGCGGT GCTACTCGGC 
GGCGTGTGGG ATCGGGTTCC CGCCACCCAG ACCTACGAAG ACCTCGCCGC GTCCGGCTAC 
GAGCCGGCGT TCTTCCTGCC CAACTGA

Protein sequence

MAADSGRPSA SGARVTGDDL QYAVAWHAAL RTLVPHSGAN AVTVEAVTAG NVDDVVIGKA 
HGPDDYMQVK ASVTAEKAAT IEWLTALSGK RGPSILQRFY RTSQQLRVDG AHPRLTLVTN 
RSIHPDDPVL TLRDRNDHLA DRLCTATNAA TAAGRRNLLR HLDCTDDELY EFLSNLRLHT 
DASEAAWRDY HIRDISHAAG VQADEVAYRL GIAEVREWVK TSRSQKRPAD IAAAIDRLGI 
RAQEPFTMVA INALDEGFTN PDARVTLDWV DRFRGSEARS RRGLKNPKEW ETVLRPQLID 
AQRTLRSLGA KRILITGTMR LPTWFTAAVM FQETAGFIPA KTKDGQLWLK PGGTIMPASI 
CLSSSIAELR PGSEVALALA ISADLTPDVT SYIASTGRDI PIITISLPSG ISGSSIADRD 
HAYAVALAVR DLSRQIARRV NPPILHLFMA APSGFAVLLG GVWDRVPATQ TYEDLAASGY 
EPAFFLPN