Gene Rcas_2039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2039
Symbol
ID	5539517
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2612614
End bp	2613762
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	60%
IMG OID	640894174
Product	homoserine O-acetyltransferase
Protein accession	YP_001432145
Protein GI	156742016
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0765159
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGCAT ATGCTACAGA ACGCGCGCCA CTTGGCGTCG GTCTTGTTCA GACACGCTAT 
GCCACCTGGC TCGAGCCGCT GATGCTCGAC AGCGGCGCAT TACTGGCGCC GGTGACGCTG 
GCATACGAGA CGTATGGCGA ACTCAGCCCG GCGCGTGATA ATGCCATTCT GATCCTGCAC 
GCGCTCTCCG GTGATGCGCA CGTTGCCGGT CGTCATAGCC TGACCGACCC CAAACCGGGA 
TGGTGGGATG CTATGGTCGG TCCCGGTCGT CCCTTCGATA CCGACCGTTA CTTCATCATC 
TGCTCGAATG TCATCGGCGG GTGCAAGGGA AGCACCGGAC CCTCCAGCAT TGACCCGGCG 
ACAGGCAAGC CGTATGGCTT GCGCTTCCCG GTCATCACCA TTAGCGACAT GGTACGTGCA 
CAGACGCGCC TGATCGATCA TCTGGGGATC GATCGATTGC TTGCTGTCGC CGGCGGCTCA 
ATGGGTGGAT TTCAGGCGCT CGAGTGGGCA ACCGCATACC CGGAACGGGT GCGTAGCGCC 
ATTCTGCTGG CGACAACAGC GCGTTCATCG GCGCAGACCG TGGCATGGAA CGCGATCGGG 
CGCCGCGCGA TCATGGCCGA TCCGCGCTGG CGCGGCGGCG ACTACTACGG TTATGAGCCG 
CCAGTCGATG GTCTGGCGAC AGCGCGCATG ATTGGGCACA TTACCTATCT AAGCGAACTC 
TCCCTGGAGC GCAAGTTCGG GCGCGCGTTC CAGCGCGGCG CTCCTTCCTT CACAATGGAA 
CAGGAATTCG CTATCGAAAG TTATCTCGAA CATCAGGGCG CAAGTTTCAA TGCCCGCTTC 
GACGCTAATT CATACCTCTA CATTACCAAA GCCATGGATT ACTGGGACTT GCCGGCGCGC 
TACGGATCGC TGGACAGAGC ATTTGCCCGC ACCCAGGCGC GCTTCCTCCT GCTGTCGTAC 
AGCAGCGACT GGCTCTATCC AACAGCGGAG TCGCTCGCTA TCGCCGATGC GCTGCGCCGC 
ATGCACAAGC CGGTCGAGCA TGTCGAGATC GCCTCGATCG CAGGTCACGA CGCATTTCTC 
GTTGATATCG ATCAGCAAGC GCCGATTATT ACGGAGTTTC TCAACGGATT GACCCGCGAG 
CGAGGTTGA

Protein sequence

MIAYATERAP LGVGLVQTRY ATWLEPLMLD SGALLAPVTL AYETYGELSP ARDNAILILH 
ALSGDAHVAG RHSLTDPKPG WWDAMVGPGR PFDTDRYFII CSNVIGGCKG STGPSSIDPA 
TGKPYGLRFP VITISDMVRA QTRLIDHLGI DRLLAVAGGS MGGFQALEWA TAYPERVRSA 
ILLATTARSS AQTVAWNAIG RRAIMADPRW RGGDYYGYEP PVDGLATARM IGHITYLSEL 
SLERKFGRAF QRGAPSFTME QEFAIESYLE HQGASFNARF DANSYLYITK AMDYWDLPAR 
YGSLDRAFAR TQARFLLLSY SSDWLYPTAE SLAIADALRR MHKPVEHVEI ASIAGHDAFL 
VDIDQQAPII TEFLNGLTRE RG