Gene Cag_1562 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1562
Symbol
ID	3746562
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2047657
End bp	2048772
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	40%
IMG OID	637774102
Product	hypothetical protein
Protein accession	YP_379860
Protein GI	78189522
COG category	[S] Function unknown
COG ID	[COG4804] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAAA AAGAAGTAGT TGCTCATGCA ACGTTTGTGC AGCTTGTTGA AAGCATTCGT 
AATGTTCACC AAGAGCTTAT TGCACAAGCC AATAGGGCGG TTAATGTGAG CCTTACCTTG 
CGTAATTGGT TGATTGGTTA TTACATCGCT GAATATGAGT TGCAAGGCAA AGATAGAGCG 
GAGTATGGCG ACCGCTTATT TAGTGAACTT GCTCGTGCGT TAAAGTCGTT GAGTAACTGT 
AACCGTCGTC AACTCTATCG TTATTATCGT TTTTATACAT TTTATCCTAT AATTGTAGAA 
TTACTCCCCC CACAATTCAA GTCGTTATCG TTATTGTCGT CAATAGAAAT AGTGGGGACA 
GTGTCCCCAC TATCCCGGCC ATCATCCACA GCGTCATTAA ATATCGCAAA AAAGCTTAGT 
TACAGCCATT TTGAAGAACT TATCGCTCTT GACGATCCAA CCAAACGAGC TTTTTACGAA 
GTGGAGTGCA TTCGAGGCAA TTGGTCGGTG CGTGAGCTAA AACGTCAAAT TGGTAGCCTT 
TATTATGAGC GCACAGGGCT TTCATTCAAT AAAACAAAAC TTGCGGAGCT TACCCTGCAA 
GAGAGGGAAA TGCAACCTCT TTTTAATATT CGTGATCCTT ACATTTTTGA GTTTCTTGGT 
TTAAAACCTG TTGAGGTAAT GAGTGAATCT CATGTAGAGC AACAGCTTAT TGAAAAGCTA 
CAAGATTTTT TGCTTGAGCT TGGTCACGGC TTTTGTTTTG AAGCACGTCA AAAGCGTCTG 
CTTATTGGCG ATGAATATTT TTTTATTGAT TTGGTTTTTT ACCATCGTCT TTTAAAATGC 
CATGTATTGG TTGAGCTAAA GTTGGATCAT TTTAAACATG AGCATCTTGG GCAACTTAAT 
ACGTATGTTA GTTGGTATCG TCAGCATGTT ATGAGCAAGG GTGATAATCC TCCTATTGGA 
ATGTTGCTTT GTACCAGCAA AAATAATTCG CTTGTTGAGT ATGCCTTGGC AGGTATGGAT 
AATCAGCTAT TTGTTTCGCA ATATCAGCTT GAACTACCCA AAAAAGAAGA GATGCAAGAA 
TTTATAGCAA CGCAGTTACG GGAGCTTGGT GAATGA

Protein sequence

MEQKEVVAHA TFVQLVESIR NVHQELIAQA NRAVNVSLTL RNWLIGYYIA EYELQGKDRA 
EYGDRLFSEL ARALKSLSNC NRRQLYRYYR FYTFYPIIVE LLPPQFKSLS LLSSIEIVGT 
VSPLSRPSST ASLNIAKKLS YSHFEELIAL DDPTKRAFYE VECIRGNWSV RELKRQIGSL 
YYERTGLSFN KTKLAELTLQ EREMQPLFNI RDPYIFEFLG LKPVEVMSES HVEQQLIEKL 
QDFLLELGHG FCFEARQKRL LIGDEYFFID LVFYHRLLKC HVLVELKLDH FKHEHLGQLN 
TYVSWYRQHV MSKGDNPPIG MLLCTSKNNS LVEYALAGMD NQLFVSQYQL ELPKKEEMQE 
FIATQLRELG E