Gene Cag_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0501
Symbol
ID	3746370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	584389
End bp	585417
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	43%
IMG OID	637773035
Product	periplasmic phosphate binding protein
Protein accession	YP_378817
Protein GI	78188479
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR02136] phosphate binding protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTA CACAGTTTTG GAAACATGCC ACTATGGCAT TGGCTTTTGT TGGACTCGCT 
TCGGGTTCAT TAGAGGCGCG AGAACAAATT AGAATTGTGG GTTCAAGTAC CGTATTCCCA 
TTTGCAAGCT ATGTTGCAGA GGAATTTGGT AAAACCACAG GCAACCAAAC TCCTGTTATT 
GAATCAACGG GTTCAGGCGG AGGGCACAAA TTGTTTGGTG AAAGTGATGC TATTACCACG 
CCCGACATTA CCAACTCTTC ACGCAGAATG AAGAAAGCGG AATTTGATCG CGCCAAACAA 
AACGGCATAC AAGCTATCCA CGAGGTTGTA ATTGGTTATG ATGGTATTGT AATAGCAAAT 
GCAAAAAAAG CTACCACCTT ACAGCTTACC CGTCGCGACC TGTTCTTTGC GCTTGCTGAA 
GAAGTACCCA TGAAAGGTCA GCTTGTAAAA AACCCTTATA CCAAATGGAG CCAAATCCGT 
AAAGGGTTGC CAAACCAAAA GATTCTTGTG TATGGTCCTC CAACAAGCTC AGGCACCAGA 
GATGCGTTTG ATGAAATGGT AATGGAAGCA TCATCAAAGA GCATCACTGA ATATGGAGCA 
CTTGCTGGTA AGTACAAGAA AATTCGTCAA GATGGTGTTT TTGTGCCTTC AGGTGAAAAC 
GACAATTTAA TTGTACAGCG CATTGTAAAA GATAAAGCTG CGGTTGGCGT TTTTGGCTAT 
AGCTTTTTAG AGGAGAATGC CGATCGCATT AAAGGTGCAA CCATTGATGG TGTTGCGCCA 
GTGCCAGCCA ACATTACCTC AGGTAAATAT CCTGTATCGC GCGATCTTTA TTTCTACGTA 
AAAGGCTCAC ATATTGCCCA AGTAAAGGGT TTGAAAGAGT ATGTTGACCT TTTTGTTGGC 
GAAAAAATGA TTGGCGACTA TGGATATTTG AAAAAAATCG GTTTGATTCC GCTACCTAAA 
AAAGAGCGTG AAGCAATCCG TGCAAATTGG AATGCTCGTA AGATGTTAAC GGGAACAAGC 
CTCGATTAA

Protein sequence

MRITQFWKHA TMALAFVGLA SGSLEAREQI RIVGSSTVFP FASYVAEEFG KTTGNQTPVI 
ESTGSGGGHK LFGESDAITT PDITNSSRRM KKAEFDRAKQ NGIQAIHEVV IGYDGIVIAN 
AKKATTLQLT RRDLFFALAE EVPMKGQLVK NPYTKWSQIR KGLPNQKILV YGPPTSSGTR 
DAFDEMVMEA SSKSITEYGA LAGKYKKIRQ DGVFVPSGEN DNLIVQRIVK DKAAVGVFGY 
SFLEENADRI KGATIDGVAP VPANITSGKY PVSRDLYFYV KGSHIAQVKG LKEYVDLFVG 
EKMIGDYGYL KKIGLIPLPK KEREAIRANW NARKMLTGTS LD