Gene Cag_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0041
Symbol
ID	3747240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	45345
End bp	46718
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	54%
IMG OID	637772567
Product	outer membrane protein, putative
Protein accession	YP_378363
Protein GI	78188025
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.229451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAA ACATCTCCTT TCATAAAAAA ATAAGCGCAA CCTCCTTAGC GCTTTTGCTT 
GCAACATCTT CCATGAGCTA TGCCGTGGAG CCAACCTCTT CGCCATCTAC CGCATTTGCC 
GCGCCATCCG TAACACCTCT GACGCCCCTT ACGTTAGCAC AAGCGCTACA AAAAATGCAG 
GCGCATTATC CCGCGTTACA CGCTGCAAGC GAAGAGGTGA TGGCGGCTGA CGCGCGTGTG 
CGCCAAAGCA AAAGCAGCTT TCTGCCGCAG GTTACCGCTA ATGCGGGCTA TCTTTGGCGC 
GATCCCGTTT CGGAAATGAG TTTTGGTGGT GGCACGCCCA TGCAGTTTAT GCCGCACAAC 
AACTACCATG CAACGGTTAG CGCCGAGGCG ATTCTTTTTG ATTTTGGGAA GCGCAGCCGC 
GAGTTAGCAC TTGCCCAAAG TGGTACGCGC ACGGCAGAGG AGCAAGTAGC GTTAAGCCGT 
CGTGAAGCGG CATGGCAGGT GGTGCAGCTT TTTTACGGAA TACTCTTTTT GCAAGAAGAG 
CAGCGTGTGC AGCAAAAAGA GTTCCAAGCG CTGAACAAAG CGTTGGAGTT TACCACCAAG 
CGGTATCAAG CAGGCACGGC AACCTCGTTT GACCTTGCTA CCACGAAAGC GCGCCTTGCC 
GCATTGCAAA GCCGTATGGC TGACAGTGCT CATGCGTTGG AACGGAGCGA AATGCACTTT 
TGCCGTTTAA CGGAAATGAA TGCAACGCAG CCGCTTGCCT TGCAAGGCAG CTTGATGGCA 
TCGGTTGCAC CATCAAGCAA TCAAGCGCAG TTAACCGAGC AAGCGCTAAA AAATCGGGTT 
GAAACTCGCT TAGCGCGTGA AGCCGAAGCG GCGGCGGGGC AGCGTCAAGC ACTTGCGAGC 
AAGGGTGGTG CGCCACAGCT TCGGGGCAAT GTGGCGTATG GCGTTGCTAA CGGTTATCAG 
CCCGATATTG ATGAAATTCG CACCACGCTT AGTGCAGGCG TTACGCTTGA TGTGCCCATT 
TTTAGCGGCT TTCGCACCAC TGCTCGTCAG CAAGAGAGTG CGGCGGCTTT GCGGGCTGCA 
ACCCAGCGTC GGTTAGATGC CGAAGCACAA GCGGCTACCG AAGTGGCAGA GTTGCTTAAT 
GCGTTGCAGC ACAATGGTGA AAAGCTGAAC GCAACCGCAA TGCAAGCCGA GCAAGCCTCT 
TTAGCCGCAA GCCATGCACG GGCGCGTTAC GAAAATGGCA TGGCAACCAC GCTTGATTTG 
CTTGATACCG AAGCGGCGCT TTCGCAAGCG GAACTGGCTC GTTTGCAAGC GGCATATGCG 
GTAACGCTAA ATCGCTATGC GCTGCAACGA GCAACGGGCG AGGTGTTCTG GTAA

Protein sequence

MKQNISFHKK ISATSLALLL ATSSMSYAVE PTSSPSTAFA APSVTPLTPL TLAQALQKMQ 
AHYPALHAAS EEVMAADARV RQSKSSFLPQ VTANAGYLWR DPVSEMSFGG GTPMQFMPHN 
NYHATVSAEA ILFDFGKRSR ELALAQSGTR TAEEQVALSR REAAWQVVQL FYGILFLQEE 
QRVQQKEFQA LNKALEFTTK RYQAGTATSF DLATTKARLA ALQSRMADSA HALERSEMHF 
CRLTEMNATQ PLALQGSLMA SVAPSSNQAQ LTEQALKNRV ETRLAREAEA AAGQRQALAS 
KGGAPQLRGN VAYGVANGYQ PDIDEIRTTL SAGVTLDVPI FSGFRTTARQ QESAAALRAA 
TQRRLDAEAQ AATEVAELLN ALQHNGEKLN ATAMQAEQAS LAASHARARY ENGMATTLDL 
LDTEAALSQA ELARLQAAYA VTLNRYALQR ATGEVFW