Gene Cphamn1_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1049
Symbol
ID	6374720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	1137419
End bp	1138909
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	52%
IMG OID	642683550
Product	inosine-5'-monophosphate dehydrogenase
Protein accession	YP_001959471
Protein GI	189500001
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0516] IMP dehydrogenase/GMP reductase
TIGRFAM ID	[TIGR01302] inosine-5'-monophosphate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.0106058
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAAA TACTCTACGA AGCGCTTACG TTTGATGATG TGTTGCTCGT ACCCGCTTAC 
TCGGCGATTC TTCCTAAAGA AACGAGCGTC AAGACCCGCC TCACGAAAAA CATTCAGCTG 
AATATTCCGC TGGTCAGTGC GGCTATGGAT ACGGTTACGG AATCTGAGTT GTCAATCGCT 
ATCGCTCGCT CCGGCGGTAT AGGTTTCATC CACAAAAACC TGACAATCAG CCAGCAGGCA 
AAGGAAGTTG CGAAAGTCAA GCGGTATGAA AGCGGGATTA TCCGCAACCC TGTCACCCTT 
TATGAAAACG CGACCGTACA GGCGGCTCTT GACCTGATGC AGAAGCACTC GATATCCGGC 
ATTCCGATTA TTGAAGAACC TATAGGGCCT GATGACGCCT CTCTGAAACT TAAAGGAATC 
ATCACGAACA GGGACCTTCG CTTCAAACCT TCTCCGGACC AGAAGATTTC AAGCATCATG 
ACAAGCAGGA ACCTTATCAC CGCGGATGAA GATATAAACC TCGAAGACGC GGCAGGAATA 
CTGCTTGAAA ACAAAATCGA AAAACTGCTG ATAACTGATG GCAAAGGCAA CCTTAAAGGT 
TTGATAACCT TTAAGGATAT TCAGAAAAGA AAACTCTATC CTGACTCCTG CAAAGATGAA 
GATGGCAGGC TTAGAGCCGG CGCGGCTGTC GGCATTCGTG CAGACACCAT AGACCGGGTA 
ACCGCTCTTG TCGAGGCAGG AGTGGATGTT GTCGCGGTCG ATACTGCGCA TGGTCACAGT 
AAGGCTGTCT CTGATATGGT GAGAACCATC AAGAAAAGCT TCCCTGATCT TCAGGTGGTC 
GCAGGAAACG TTGCTACCGC CGATGCCGTC CGGGATCTCG TTGCGGCAGG CGCGGATGCC 
GTCAAAGTCG GTATCGGACC GGGCAGCATC TGTACGACTC GTGTTGTTGC GGGCGTCGGC 
ATGCCGCAGC TGACTGCTGT CATGAAATGC GCGGAAGAAG CGGCCAAAAC AGGAACGCCG 
CTCATCGCTG ACGGCGGCAT CAAATACAGC GGAGACATCG CCAAGGCTAT TGCCGCAGGC 
GCCGATTCAG TAATGATCGG CAGCATCTTT GCCGGAACGG ATGAAAGTCC CGGGGAAACG 
ATACTCTATG AAGGGAGGCG CTTCAAGGCA TACAGGGGAA TGGGCTCGCT TGGAGCCATG 
TCGGAACCGG AAGGAAGCAG CGACCGGTAT TTCCAGGATG CTTCAAAAGA AAGCAAAAAA 
TACGTTCCGG AAGGGATTGA AGGCCGGATA CCGGCAAAAG GAAAGCTGGA AGAGGTTATC 
TATCAGCTGA TCGGTGGCCT GAAATCGTCG ATGGGTTACT GCGGTGTACG CTCTACGGAT 
GAAATGAAAA ACAACACCAG CTTTGTGCGT ATCACCCAGG CCGGACTGAG AGAGAGCCAT 
CCCCATGATG TCAAGATCAC CAAAGAAGCC CCGAACTACT CGGTGTCTTA G

Protein sequence

MSKILYEALT FDDVLLVPAY SAILPKETSV KTRLTKNIQL NIPLVSAAMD TVTESELSIA 
IARSGGIGFI HKNLTISQQA KEVAKVKRYE SGIIRNPVTL YENATVQAAL DLMQKHSISG 
IPIIEEPIGP DDASLKLKGI ITNRDLRFKP SPDQKISSIM TSRNLITADE DINLEDAAGI 
LLENKIEKLL ITDGKGNLKG LITFKDIQKR KLYPDSCKDE DGRLRAGAAV GIRADTIDRV 
TALVEAGVDV VAVDTAHGHS KAVSDMVRTI KKSFPDLQVV AGNVATADAV RDLVAAGADA 
VKVGIGPGSI CTTRVVAGVG MPQLTAVMKC AEEAAKTGTP LIADGGIKYS GDIAKAIAAG 
ADSVMIGSIF AGTDESPGET ILYEGRRFKA YRGMGSLGAM SEPEGSSDRY FQDASKESKK 
YVPEGIEGRI PAKGKLEEVI YQLIGGLKSS MGYCGVRSTD EMKNNTSFVR ITQAGLRESH 
PHDVKITKEA PNYSVS