Gene Cmaq_0731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0731
Symbol
ID	5708628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	764621
End bp	765643
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	43%
IMG OID	641275232
Product	homoserine dehydrogenase
Protein accession	YP_001540557
Protein GI	159041305
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.00124152
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTAAAA TAGCCTTAAT AGGGTTTGGT AATGTTGGGA AATCCTTCGC AAGGGTATTA 
ATCAATAGGG CCACTGAATT AACTAAGCTG GGGCTAGAAC CCTGCGTAAT AGGTGTACTT 
GCATCAAGGG GTGGTTTAAT TAATGATAAC TGCATAGGTG GTGGAACACT CATGGACTTA 
GTTAATAAAG GCCTATATAA TGCGCCTGGC TTTAAGGCAG TTAATTTAAG GGACTTAATT 
AAACTTAAAC CAGACATCGC AGTAGTATCA ATACCACCAA GTTACCGCAC TGGTGAACCG 
AATCTAACAA TATATAGGTT ATTGATAAGT GAAGGCGTAT CAGTTATTAC CGCTGATAAA 
ACAGGATTAG CCTTAGCCTA CTGGGAATTA ATCAATGAGT CAAGGGCTAG GGGAGTCTTC 
CTAGGCTTCA CGGCTACGGT TATGGCTGGT ACGCCGGTGA TTCAACTGAT TAAGGGATTA 
AGGGGTAGGG TTGTTGAAAG CATTGAAGGT GTTTTAAACG CTACGTCAAA TTACGTCCTA 
ACCCTTGTGG AGAATGGATT AACCATGAGT GAAGCCGTTA AGAAGGCTAT TGAGGAGAAG 
ATCGCTGAAC CAGACCCAGC AATAGACCTA GGTGGCTTAG ACGCTGCCGC TAAGGCAACC 
ATACTTGCTA ATGTGCTGGG CCTTAATGTG AGCTTAAGGG ATGTTAATGT TCAATCATTA 
ATGAGCCTTA AGGATGATTA CATTAAGGAA TGCGCAAGGA GGGGTGTTAG GGTTAAGCAA 
GTTGCCTCAA TAAGCTTAAC CAGCAGGGTA TTAAGCGTTA AGCCAATGGA GGTTCCAACA 
GGTAGTGTGC TTGGCTCCAT TACAGGTAAC TACAATGCCT TAGTAATTAG GCTTAATGAT 
GGGAAGGAAA TAACGGTAAT AGGCCCAACA GGCCCGGCTG AGGCAACAGC CGAGGTAATG 
TTCAGTGATT TACTTGAATA CGCCGACTTA TTACTAACCA TGGGAAAGCG TATTAAGGGT 
TAA

Protein sequence

MIKIALIGFG NVGKSFARVL INRATELTKL GLEPCVIGVL ASRGGLINDN CIGGGTLMDL 
VNKGLYNAPG FKAVNLRDLI KLKPDIAVVS IPPSYRTGEP NLTIYRLLIS EGVSVITADK 
TGLALAYWEL INESRARGVF LGFTATVMAG TPVIQLIKGL RGRVVESIEG VLNATSNYVL 
TLVENGLTMS EAVKKAIEEK IAEPDPAIDL GGLDAAAKAT ILANVLGLNV SLRDVNVQSL 
MSLKDDYIKE CARRGVRVKQ VASISLTSRV LSVKPMEVPT GSVLGSITGN YNALVIRLND 
GKEITVIGPT GPAEATAEVM FSDLLEYADL LLTMGKRIKG