Gene Francci3_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1000
Symbol
ID	3906686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1189981
End bp	1191759
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	64%
IMG OID	637878333
Product	3-hydroxyacyl-CoA dehydrogenase
Protein accession	YP_480112
Protein GI	86739712
COG category	[I] Lipid transport and metabolism
COG ID	[COG1250] 3-hydroxyacyl-CoA dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATCC AGCTCAACGG CACGAAGGTC GGAGTTGTCG GGCTCGGCAC GATGGGCGCC 
GGCATCGCCG AGGTAATGGC GCGCGCCGGC ATCGAGGTGG TCGGCGTCGA GCTCAACGAC 
GAGACGCTGG CCCGTGGGCT CGATCGGATC CGGCACTCCA CGGACCGGGC GATGAGCCGC 
GGCAAGTTGA CCAAGGTCGA GCGGGACGCC CTGCTCGCCC GTATCCAGGC CGGAACCGGG 
ATCGAGGCCG TGGCCGACTG CCAGCTGGTC ATCGAGGCGA TTCCCGAGCG GATCGAGAAG 
AAGCTCGGGC TCTTCGCCGA GCTGGACAGG CTGTGTCCGC CAGAGACGAT CTTTACGACG 
AACACCAGCT CCCTGCCAAT CATCACGTTG GCCGTCGCTA CCTCACGCCC CTCCCGGGTT 
GTCGGGACCC ACTGGTCCAA CCCCGCACCG GTCATGGGCC TGGTCGAGAT CATCCATACT 
GCGGTCACCG ACCCGTCTGT ACTGGAGGAT GTCGGGACGC TCGTCGCGAA GGTCGGAAAG 
ACCGCGGTGG TCGCCGGGGA CCGGGCGGGT TTCATCGTGA CCGCCCTGCT GTTCGGGTAC 
CTTAACAGCG CTGTCCGGAT GCTGGAGGCG TGCTACGCCA CCCGTGAGGA CATCGACGCC 
GCCATGCGGT TCGGCTGCGG TCACCCGATG GGCCCATTGG CACTGCTCGA TCTGATCGGT 
CTCGACTCCG CGTACGAGAT TCTCGACTCG ATCTATCACA CCTCCCGCGA CCACCTGCAC 
GCACCGGCCC CGCTGCTCAA GCAGCTAGTG ACCGCCGGCA TGCTCGGCCG CAAGACCGGG 
CGGGGTTTCT ACACCTATGC CGCCCCTTAC TCCTCCGAGA TCGTCGACAT GGTCGAACCA 
CCCCAACTCG GCTTCTTCGC GGTCCCAGGA CGGCCGGTGC ACACGATCGG CGTGGTCGGC 
ACCGGCACCA TGGCCAGCGG AATCATCGAG GTCTGTGCCC ACCATGGCTA CAAGGTGGTG 
TTCCGTGCAC GGAGCGAGAA GAAAATCGCC GCTGTCCGGA CGAAGATCGA GCGGTCACTG 
GACAAAGCGG TCGAACGGGG AAAGATCTCA TCGGACGAGC GTACTTCGAC ACTGGCACGG 
GTTCGAGCTT CGACCGATCT GTCCGTCCTC GCCGAGTGTG ACCTCATCAT CGAAGCGGTC 
GTTGAGGACT TGGACGTCAA ACGGGCGCTG TTCGCTGAAC TCGACACGGT TGCACGCCCG 
GGAGCGGTCC TCGCGACGAC CACGTCCTCG CTGCCAGTGA TCGAGTGTGC CACCGCCACG 
TCCCGCCCGC AGGATGTGGT CGGTATGCAC TGGTTCAACC CAGCGAAGAA GATGCGCCTG 
GTCGAGATCG TGCCGACCAT CGTAACCGCG GACGACGTGA CCGCGACTGT CTTCGACGTG 
GCCAGGACGG CGGGCAAGTA CCCGGTCCGG TGTGCCGACC GCGCCGGCTT CATCGTCAAC 
ACCCTACTGT TCCCATATCT CAATGACGCG GTGAAGATGC TGGAGTCCCA TTACGTGGAT 
ATCGATGTGA TCGATACAGC CATGAAGGTC GCCTGCGCAC ACCCGATGGG GCCGTTCGAA 
CTCGCCGATG TCATCGGCCT GGACGTGACA CTCGCCATCC AGCGCGCCCT GTACCGGGAG 
TTCCGCGAAC CCGGGTACAC CCCGACGCTC CTGCTGGAAG ACCTCGTCAG GTCCGGATGT 
CTGGGGTACA AGACCGGGCG GGGTTTCCGG GTCTACTGA

Protein sequence

MDIQLNGTKV GVVGLGTMGA GIAEVMARAG IEVVGVELND ETLARGLDRI RHSTDRAMSR 
GKLTKVERDA LLARIQAGTG IEAVADCQLV IEAIPERIEK KLGLFAELDR LCPPETIFTT 
NTSSLPIITL AVATSRPSRV VGTHWSNPAP VMGLVEIIHT AVTDPSVLED VGTLVAKVGK 
TAVVAGDRAG FIVTALLFGY LNSAVRMLEA CYATREDIDA AMRFGCGHPM GPLALLDLIG 
LDSAYEILDS IYHTSRDHLH APAPLLKQLV TAGMLGRKTG RGFYTYAAPY SSEIVDMVEP 
PQLGFFAVPG RPVHTIGVVG TGTMASGIIE VCAHHGYKVV FRARSEKKIA AVRTKIERSL 
DKAVERGKIS SDERTSTLAR VRASTDLSVL AECDLIIEAV VEDLDVKRAL FAELDTVARP 
GAVLATTTSS LPVIECATAT SRPQDVVGMH WFNPAKKMRL VEIVPTIVTA DDVTATVFDV 
ARTAGKYPVR CADRAGFIVN TLLFPYLNDA VKMLESHYVD IDVIDTAMKV ACAHPMGPFE 
LADVIGLDVT LAIQRALYRE FREPGYTPTL LLEDLVRSGC LGYKTGRGFR VY