Gene Cag_1059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1059
Symbol
ID	3747042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1440094
End bp	1441092
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	46%
IMG OID	637773590
Product	hypothetical protein
Protein accession	YP_379364
Protein GI	78189026
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0702] Predicted nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00000180564
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAACA AAAAGCGGGT GTTTGTTGTT GGTTCAACGG GCTACATTGG TAAGTTTGTG 
GTGCGCGAGT TGGTGGCGCG AGGTTACCAT GTGGTGAGTT TTGCTCGTGA GCGTTCGGGG 
GTTGGTGCTG CCACAACGGC TGAGCAGCTT CGGCAAGATT TAAAGGGTTC GGAGGTGCGT 
TTTGGGGATG TGGGCAACAT GCAATCGTTG CGTGCCAATG GTATTCGGGG TGAGCATTTT 
GATGTGGTTG TCTCTTGCTT AACCTCGCGC AATGGAGGCA TTCAGGATTC GTGGAATATT 
GATTATCAAG CAACGCGCAA TGCGCTTGAT GCCGCTAAAG CGGCTGGTGC AACGCAGTTT 
GTGCTGCTTT CGGCAATTTG TGTGCAAAAG CCTATGCTGG AGTTTCAGCG GGCAAAGCTG 
AAGTTTGAGC GTGAGTTGCA GGAATCGGGG TTAACGTGGT CAATTGTGCG TCCAACAGCC 
TTTTTTAAGT CTATTGCGGG GCAGGTTGAA GCGGTAAAAA ATGGTAAGCC TTTTGTGATG 
TTTGGCAATG GTCGTTTAAC GGCATGTAAA CCTATTAGTG AAGCTGATTT GGCGCGTTAC 
ATTGTTAATT GCATTGATGA TAGTTCCATG CAGAATAGAA TTTTACCGAT TGGTGGACCT 
GGTCCTGCTA TAACGCCGCT TGATCAAGGG ATGATGCTTT TTGAATTGCT GGGTCGTGAG 
CCAAAGTTTA AGAAAATGCC CATCCAAATG TTTGATGTTA TTATTCCCGT GCTTGCTTTG 
CTTGGTAAAA TTTTTCCGCA GTTTAAGGAA AAGGCGGAGT TTGCACGAAT TGGGAAATAT 
TATTGTTCAG AATCAATGCT TGTGCTTGAT CCAAAAACGG GTAACTATAA TGCTGCAATA 
ACGCCTTCGT TTGGGAGTGA TACGTTACGT GAGTTTTATG GTCGAGTGTT GAAGGATGGG 
TTGAAGGGGC AGGAGTTGGG TGAACATGCA ATGTTTTAA

Protein sequence

MDNKKRVFVV GSTGYIGKFV VRELVARGYH VVSFARERSG VGAATTAEQL RQDLKGSEVR 
FGDVGNMQSL RANGIRGEHF DVVVSCLTSR NGGIQDSWNI DYQATRNALD AAKAAGATQF 
VLLSAICVQK PMLEFQRAKL KFERELQESG LTWSIVRPTA FFKSIAGQVE AVKNGKPFVM 
FGNGRLTACK PISEADLARY IVNCIDDSSM QNRILPIGGP GPAITPLDQG MMLFELLGRE 
PKFKKMPIQM FDVIIPVLAL LGKIFPQFKE KAEFARIGKY YCSESMLVLD PKTGNYNAAI 
TPSFGSDTLR EFYGRVLKDG LKGQELGEHA MF