Gene Cag_1441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1441
Symbol
ID	3746640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1908495
End bp	1909598
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	34%
IMG OID	637773976
Product	hypothetical protein
Protein accession	YP_379741
Protein GI	78189403
COG category	[S] Function unknown
COG ID	[COG3177] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAGCTT TTATCCATCA AAAAACCAAT TGGCCTTATT TCACTTGGAA CAATGATGAA 
ATAGTTAATG CGCTGAGTGA AGCAAGAAAT TTGCAAGGAA GAGTCATTGG TAAAATGGAA 
TCTTTAGGAT TCGACCTAAG AAATGAAGCT CTACTTGACA CGTTAACACT TGATGTATTA 
AAATCGTCAG AAATAGAAGG AGAATATTTA AATCCTGAAC AGGTTCGTTC CTCAATTGCC 
CGTAGATTGG GAATGGAAAT TGCCGGTTCT GTTGAGTCGG ATAGAAATGT TGATGGCGTA 
GTCGAAATGA TGTTGGATGC AACACAAAAT TGCTTTAAAC CATTAACAGT TGAAAGACTC 
TTCGATTGGC ATGCAGCATT ATTCCCGACT GGAAGAAGTG GAATGCTCAA AATTACAGTC 
GGCGATTGGC GAAAAGATAC GACAGGTCCA ATGCAAGTTG TGTCGGGAGC CTTAGGAAAG 
GAAAAAGTGC ATTTTCAAGC TCCCGATTCG ATAGTTGTTG AAAAAGAGAT GAATCAGTTT 
TTAGAGTGGA TTAATAATAA TGTAAAAATT GATTTAGTCA TTAAAGCTGC TATAGCTCAC 
TTATGGTTTG TTACCATCCA TCCATTTGAA GATGGAAATG GTAGGATAAC AAGAGCGTTG 
ACCGATATGT TATTGGCACA ATCGGATAAT AGCAATCAGC GTTTTTATAG TATGTCTGCA 
CAAATCAGAA TTGAAAGAAA GCAATATTAT GACATACTGG AAAAGACACA AAAAGGGAAC 
CTTGATATAA CAGAATGGAT TCAGTGGTTT TTAAACTGCC TTATTAATGC TTTAAAATCA 
ACTGATGCTA CATTATTTAA CGTTTTATTA AAAGCAAACT TCTGGAGTAA ACATTCTAAA 
ACATTGATAA ATGAAAGACA GAAGAAACTT TTAAATAAAT TATTAGATGG ATTTGATGGA 
AAAATAACAT CATCAAAATG GGCAAAGATT GCAAAATGCT CAAAAGACAC TGCCATAAGA 
GATATAAATG ATTTGATAGA AAAAAATATT CTACAAAAAG AAGCAGGAGG AGGAAGAAGT 
ACAAATTATG AATTAAAGAT ATGA

Protein sequence

MVAFIHQKTN WPYFTWNNDE IVNALSEARN LQGRVIGKME SLGFDLRNEA LLDTLTLDVL 
KSSEIEGEYL NPEQVRSSIA RRLGMEIAGS VESDRNVDGV VEMMLDATQN CFKPLTVERL 
FDWHAALFPT GRSGMLKITV GDWRKDTTGP MQVVSGALGK EKVHFQAPDS IVVEKEMNQF 
LEWINNNVKI DLVIKAAIAH LWFVTIHPFE DGNGRITRAL TDMLLAQSDN SNQRFYSMSA 
QIRIERKQYY DILEKTQKGN LDITEWIQWF LNCLINALKS TDATLFNVLL KANFWSKHSK 
TLINERQKKL LNKLLDGFDG KITSSKWAKI AKCSKDTAIR DINDLIEKNI LQKEAGGGRS 
TNYELKI