Gene Cag_0423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0423
Symbol
ID	3747689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	497006
End bp	498565
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	47%
IMG OID	637772953
Product	exopolyphosphatase, putative
Protein accession	YP_378739
Protein GI	78188401
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAG AAGCATTGCG CGTAGCGGCT ATTGATCTTG GTACCAACTC TTTCCACATG 
ATTATTGTGG AGGGAAGTCG CGATAAAGGT ATTGTTGAAA TTGACCGCGT GAAGGATATG 
ATTGGCATTG GGCATGGCAG TATTGCCACT AAAATGCTGA CGGAGGAGGC AATGCAAGCG 
GGCATAGCAA CGCTAAAGAA GTTTTTAGTG TTAGCTGCCC AGCATGGCGT GCAATTTGAG 
CATATTCTTG CTTTTGCTAC CAGCGCCATT CGCGAAGCAA AAAATCGTCT TGATTTTATT 
AATCGTGTTC GGGCTGAAAC GGGCTTAAAA GTCAAGATTA TTTCGGGTAA AGAGGAGGCG 
GAGTTTATTT ACTACGGCGT GCGCAATGCG GTAAGTGTTG GCAAAACGGC GGATTTGATT 
TTTGATATTG GTGGCGGTTC GGTGGAGTTT GTGTTAGTGA ATCACAAAGG GGTGCAACTG 
CTTGAAAGCC GTAAAATTGG TGTGGCGCGT ATGCACGAGC GCTTTGTTTC AAGCGATCCC 
ATAGCAGCAA ACGATGTTAA AATGCTTGAA CAATTTTTTG CGGCTGAAAT GGTTTCGGCG 
GTGGATAAAG CTACGACAAT GAAAGTGCGT CGTGCGGTTG CGTCATCAGG CACAGCCGAG 
ACCATTGCCC GCATGATTCA CGCCATGCAA GGGCGCGATA GCGATGGCGC GTTAAACAAT 
AGTTGCTTTA CGCGCAGTGA GTTTCAGCAA CTCTACCACA CCGTGTTGCT CATGAATTCA 
GCAGAGCGCA AAAAAATGAG CGGCTTGGAT GAAAAGCGGG TTGATTTAAT TGTGCCAGGG 
CTCATTTTAG TGGATATGAT TTTTAAGCTC TTTCGGCTTG AAGAAATTGT TATTGCCGAT 
TCGGCTTTGC GTGAAGGCAT GGTGCTGCAC TACTTGCAGC AGCAAGGTTC GGTGCTTAAA 
AAACGAGGTC ATCAAGAATC GCTTGATATT CGGCGCGAAA GCGTTAATGA GCTGGGATTC 
CGTTGCCATT GGGATCGTGG GCATTCGGAA TACATTGCTC GCCTCTGCCT TCAGCTTTTC 
GATAAACTTG CTCCCCTCCA TCAGCTTGAA GAAAATTATC GTGAATTGCT GGAATATTCT 
GCTCTTCTGC ACAACATTGG AGCCTTTATT TCAATCTCCT CCCATCATAA GCATAGCCAA 
TACATTGTCA TGAATGGCGA GTTGCGCGGC TTTTCTCCCT CCGAAATTGC CATTCTTGGG 
CATGTAGTGC GCTACCATCG TAAGTCGCCC CCTTCCGAAA AACATACGCC CTATAATGCC 
TTAAAGCTGC CGCACAAACG GGCGGTTGAT GTGCTTTCGG GCATTTTGCG CATTGCCAAC 
GGCTTGGAAC GTGGACATCG CCAAAACGTG CAAAATGTTG ATGTGCAAGT AAAAGGCAAA 
AGCATTACCA TGGCGCTAAC CTGCTGCTTT GAACCCGATA TTGAAATATG GGCAGCCGAT 
CAACTCAAGG CGTGGCTTGA AACGGTGCTA CAAAAAACCA TCCATTTTCA ACGCGCGTAA

Protein sequence

MNKEALRVAA IDLGTNSFHM IIVEGSRDKG IVEIDRVKDM IGIGHGSIAT KMLTEEAMQA 
GIATLKKFLV LAAQHGVQFE HILAFATSAI REAKNRLDFI NRVRAETGLK VKIISGKEEA 
EFIYYGVRNA VSVGKTADLI FDIGGGSVEF VLVNHKGVQL LESRKIGVAR MHERFVSSDP 
IAANDVKMLE QFFAAEMVSA VDKATTMKVR RAVASSGTAE TIARMIHAMQ GRDSDGALNN 
SCFTRSEFQQ LYHTVLLMNS AERKKMSGLD EKRVDLIVPG LILVDMIFKL FRLEEIVIAD 
SALREGMVLH YLQQQGSVLK KRGHQESLDI RRESVNELGF RCHWDRGHSE YIARLCLQLF 
DKLAPLHQLE ENYRELLEYS ALLHNIGAFI SISSHHKHSQ YIVMNGELRG FSPSEIAILG 
HVVRYHRKSP PSEKHTPYNA LKLPHKRAVD VLSGILRIAN GLERGHRQNV QNVDVQVKGK 
SITMALTCCF EPDIEIWAAD QLKAWLETVL QKTIHFQRA