Gene Haur_3970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_3970
Symbol
ID	5735831
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	5047747
End bp	5048877
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	62%
IMG OID	641281120
Product	acyl-CoA dehydrogenase domain-containing protein
Protein accession	YP_001546730
Protein GI	159900483
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.493916
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAATCG AGCTTACTGA ACAGCAAGCC AGCGCGAAGG CGGCGTTTCG TGCCTTCGTC 
GATCATGAAA TCGTGCCATA CGCCGACCAA TTCGATCGCG AGGAGCGCGT CCCGGCGGCC 
GTTATCCAAA AGCTGGCCCG CGAGGGCTAC TTGGGCCAGG TCGTTCCCGA AGAGCAAGGC 
GGCACCGGCA GCGATATGGT CACCTTTGGT ATCCTCAACG AGGAGTTGGG GCGCGGCTGC 
TCATCGATCC GGAGCCTGCT GACGGTGCAT AGCATGGCGG CGTTCGCCGT GTTGAAGTGG 
GGCAGCGCAG ACCACAAAAG CCGCTTTCTG TCCCGGCTGG TCAGCGGTGA GATCATCGGC 
GCGTTTGCCT TGAGTGAGCC GAACGTCGGC AGCGACGCCA AAAGCGTCGA AACTTCCGCC 
CGTTTGGTCG GCGACCGCTA CGTGCTCAAC GGGCGCAAGC GCTGGATGAC CTTCGGCCAG 
ATCGCCGATG TGTTCCTGCT GTTCGCCCAG GTCGAGGGCA AGGTGACGGC CTTCCTGGTC 
GAAAGGAACA GCCCCGGTTT CTCGACCGAG CCAATCACAG GCATCCTGGG CACCCGCGGC 
TCCATGCTTG CCGAACTGCG CTTGGACGAT TGCGAGATCC CTAAGGAAAA TCGCCTCGGC 
GGGCTGGGCT TCGGCCTAGC GGCGATCGGC ACGTCGGCCC TGGACATCGG CCGCTACAGC 
GTCGCTTGGG GCAGCGTTGG CATCGCCCAG GCATGCCTGG AAGCCTGCGT GGAGTATACC 
AGCACCCGGC GGCAGTTCGG CGTGCCGATC AAAGATCACG ATCTGGTGCG CCAGATGATG 
ACCAATATGA TCACGAACAC CAAGGCGGCC CGCATGCTGT GCTATCAGGC CGGCTATCTC 
AAGGATAGCG GCGACTCGCG CACGGTGATG GAAACATGGA TCGCCAAATA CTTCGCCTCA 
ACCGCAGCCA TGAAGATCGC TGCGGACGCC GTCCAGCTCC ACGGCGCCAA CGGCTGCAGC 
GAGGAGTATC CGGTGCAGCG TTACTTCCGC GACGCCAAGA TCATGGAAAT CATCGAGGCC 
AGCACCCAGC TCCAACAGAT GAACATCGCC CAGTACGCCT ACGAGTACTA A

Protein sequence

MRIELTEQQA SAKAAFRAFV DHEIVPYADQ FDREERVPAA VIQKLAREGY LGQVVPEEQG 
GTGSDMVTFG ILNEELGRGC SSIRSLLTVH SMAAFAVLKW GSADHKSRFL SRLVSGEIIG 
AFALSEPNVG SDAKSVETSA RLVGDRYVLN GRKRWMTFGQ IADVFLLFAQ VEGKVTAFLV 
ERNSPGFSTE PITGILGTRG SMLAELRLDD CEIPKENRLG GLGFGLAAIG TSALDIGRYS 
VAWGSVGIAQ ACLEACVEYT STRRQFGVPI KDHDLVRQMM TNMITNTKAA RMLCYQAGYL 
KDSGDSRTVM ETWIAKYFAS TAAMKIAADA VQLHGANGCS EEYPVQRYFR DAKIMEIIEA 
STQLQQMNIA QYAYEY