Gene Francci3_1269 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1269
Symbol
ID	3906115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1515171
End bp	1516535
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	69%
IMG OID	637878603
Product	CBS
Protein accession	YP_480376
Protein GI	86739976
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.183003
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCCG GTGATCTTTT TCTCGTCTTC ATCGCCGTGA TGGGCTCGCT TGCCGCGGCG 
GGTCTCGGCG GCATCGACGC GGCCCTGACC CGGGTCTCCC GGGTGACGGT CGAGGGTTTC 
TCCCGCCAGG GCCGGGCCGG CGCCCGGAAC CTGGCGACCG TCGTGGCCGA TCCGGGCCGC 
TACCTCGCGC TGCTGCTGCT CCTGCGCATC GTCGCGGAGA TGCTCGCCGC GGCCTGTATC 
ACGGTGCTGT TCGTGCACGC CTACGGGGCC GGGTTCGCCG CGATCGGCCT CGGGACGCTG 
GCCTCGACCC TGGTCGCGTA CATCCTCGTC GGGGTGATGT TCCGCACCCT GGGCCGCCAG 
CACGCCCCTG CGGTGGCGTT GGCCAGCGCC GGTCTCACGG TCCGGCTGGC GCGGATCTTC 
GGGCCGTTGC CCCGGCTGCT GATCGCGTTC GGCAACGCGG TCACCCCCGG TCCTGGTTTC 
CGGGATGGTC CCTTCGCATC CGAGGCCGAG CTGCGCGATC TCGTCGACCT CGCCGAGGAG 
AACGAGGTCA TCGAGCGTGA GGAACGCGAC ATGATCGCGT CGGTGTTCGA GCTCGGGGAC 
ACCCTGGTGC GCGAGGTGAT GGTGCCGCGT CCGGACATGG TCTTCATCGA GTCGACGAAG 
ACCGTCCGGC AGGCTCTCGC GCTGGCCCTG CGCAGCGGCT TCTCGCGGAT CCCCGTCATC 
GGGGAGAGCG TCGACGACGT GGTGGGGATC GCCTTCCTCA AGGACATGGT CCGCCGGGAA 
CGGGAGGGGG GCGAGGATGG TGCGATCGCC GAGATCATGC GTTCACCCGC ACTCGTGCCC 
GAGAGCAAGC CCGCGGACGA CCTGCTCCGT GAGATGCAGG CGTCGCGTAC CCACATGGCG 
ATCGTCATCG ACGAGTACGG TGGAACCGCC GGACTCGTCA CCATCGAGGA CATCCTTGAG 
GAGATCGTCG GTGAGATCAC CGACGAGTAC GACAACGAGG TTCCGCCGGT GGAGTGGATC 
GACGCCAACA CCGCGCGGGT GACCGCCCGG CTCGACGTCG ACGATCTGGC GAAGCTGTTT 
GACTTCGACG TGGACGACCT GCCCGGTGCG GATGACAGCC TCACCGTCGG TGGCCTGCTG 
GCCACGGCCC TGGGACGGGT GCCCATCCCG GGTGCGACGG TCACGGTCGG TGGGTTGCGG 
CTGTCGGCGG AACGGGCCGC CGGCCGGCGT AACCAGATTG GCACCGTGGT CGTCCAGCGG 
TTGCCGCATC CGTCGAACGG CGACGACGGC TCGCCGCCTC CCCGATCCGA CGACGGCGGC 
GAACCCGTGC GCAGCTCGTC GTCGGACAGA AAGGTGAATT CGTGA

Protein sequence

MSSGDLFLVF IAVMGSLAAA GLGGIDAALT RVSRVTVEGF SRQGRAGARN LATVVADPGR 
YLALLLLLRI VAEMLAAACI TVLFVHAYGA GFAAIGLGTL ASTLVAYILV GVMFRTLGRQ 
HAPAVALASA GLTVRLARIF GPLPRLLIAF GNAVTPGPGF RDGPFASEAE LRDLVDLAEE 
NEVIEREERD MIASVFELGD TLVREVMVPR PDMVFIESTK TVRQALALAL RSGFSRIPVI 
GESVDDVVGI AFLKDMVRRE REGGEDGAIA EIMRSPALVP ESKPADDLLR EMQASRTHMA 
IVIDEYGGTA GLVTIEDILE EIVGEITDEY DNEVPPVEWI DANTARVTAR LDVDDLAKLF 
DFDVDDLPGA DDSLTVGGLL ATALGRVPIP GATVTVGGLR LSAERAAGRR NQIGTVVVQR 
LPHPSNGDDG SPPPRSDDGG EPVRSSSSDR KVNS